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Foreword 


Since its inception in 1948, the Labour Force Survey (LFS) 
Nas undergone a sample redesign following each decennial 
Census of Population. The purposes of these redesigns include 
updating of the sample design to reflect changes in the size and 
characteristics of the population; adoption of improved sampling 
and estimation methods; and achievement of efficiencies through 
increased automation in the sample design and survey 
operations. Redesigns also provide an opportunity to respond to 
changes in the information needs to be met by the survey. 


The redesign of the LFS during the early 1980s responded 
to the demand for better subprovincial data, the need to identify 
efficiencies within the LFS, and the need for flexibility in the 
sample design. Efficiency gains were then redirected to new 
initiatives, such as the General Social Survey, and to programs 
which were inadequately funded. Flexibility in the sample design 
permitted future modifications to sample sizes when information 
needs and budgetary circumstances changed. 


Improvements in the cost efficiency of the survey design 
included reduction in the clustering of the sample, better 
Stratification and sample allocation schemes, and more 
telephone interviewing. The combined effect of these 
improvements permitted a reduction in the overall sample size of 
7%, lower per household data collection costs, and a significant 
reduction in the sampling error for the smaller subprovincial 
regions, without an increase in sampling error for provincial and 
national estimates. 


The flexibility built into the design for sample size changes 
was needed in 1989-90, when a major sample size increase 
was implemented to improve the reliability of survey estimates 
for Unemployment Insurance Commission Regions. 


This report describes the methodology introduced in 1985, 
when the sample redesign based on the 1981 Census was 
implemented. Also included are changes that took place as late 
as 1990. 


Predecessors to this report are Statistics Canada, 
Catalogue 71-526, which describes the LFS methodology for 
the period 1975-84, and Statistics Canada, Catalogue 71-504, 
which describes the LFS methodology for the period 1965-1974. 


Statistics Canada welcomes comments and suggestions 
from any users of this report regarding its usefulness and how it 
may be improved in the future. 


Ivan P. Fellegi 
Chief Statistician of Canada 


Avant-propos 


L’enquéte sur la population active (EPA) existe depuis 1948 et son 
echantillon a toujours éte remanié apres chaque recensement décennal 
de la population. Par ces remaniements, on cherchait notamment a 
mettre a jour le plan d’échantillonnage en fonction des changements 
dans la taille et les caracteristiques de la population, a adopter de 
meilleures methodes d’échantillonnage et d’estimation et a accroitre le 
rendement par une plus grande automatisation du plan d’echantillonnage 
et des opérations d’enquéte. Les remaniements étaient aussi pour 
Statistique Canada l'occasion de répondre aux nouveaux besoins en 
donnees d’enquéte. 


Le remaniement de |'EPA au debut des années 1980 avait pour but 
la production de meilleures données infraprovinciales en reponse a des 
besoins exprimes, la realisation d’economies grace a un meilleur 
rendement et |’etablissement d’un plan d’echantillonnage offrant une plus 
grande marge de manoeuvre. Les ressources economisées dans le 
cadre de l’EPA furent reaffectees a d'autres enquétes, notamment a 
l'enquéte sociale générale, et a des programmes insuffisamment 
finances. La moins grande rigidite du plan d’echantillonnage donnait a 
Statistique Canada la possibilite de modifier la taille des echantillons 
lorsque les besoins en information et les circonstances budgetaires 
changeaient. 


Les ameéliorations apportees au plan d’enquéte pour en accroitre 
l'efficacite comprenaient la reduction du nombre de grappes dans 
l'echantillon, de meilleures methodes pour la stratification et la repartition 
de |'échantillon et davantage d’interviews telephoniques. Toutes ces 
mesures reunies se traduisirent par une reduction de 7 % de la taille 
globale de |’echantillon, une diminution des couts de collecte par menage 
et un abaissement important de |’erreur d’echantillonnage pour les petites 
regions infraprovinciales, et ce sans deterioration des estimations 
provinciales et nationales. 


La marge de manoeuvre qu’offrait le plan d’echantillonnage au 
niveau de la taille de l’echantillon fut fort utile en 1989-1990 lorsqu'il fut 
décidé d’augmenter considérablement la taille de l’echantillon pour 
accroitre la fiabilite des estimations d’enquéte pour les regions definies 
aux fins de l’assurance-chomage. 


La presente publication decrit la methodologie adoptee en 1985, 
annee de la mise en oeuvre de |’echantillon remanié en fonction du 
recensement de 1981. De plus, les changements apportes par la suite, 
qui dans certains cas ne remontent qu’a 1990, y sont aussi ete integres. 


Statistique Canada a diffuse sur le meéme sujet deux autres 
publications, la premiere sur la methodologie de |'EPA pour la période 
1975-1984 (n° 71-526 au catalogue) et la seconde, sur la methodologie 
de |'EPA pour la periode 1965-1974 (n° 71-504 au catalogue). 


Tous les utilisateurs sont invites a faire parvenir a Statistique 
Canada leurs commentaires sur |’utilite de la presente publication et leurs 
suggestions sur la facon de |’ameliorer. 


Ivan P. Fellegi 
Statisticien en chef du Canada 
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Chapter 1 


Introduction 


1.1 Estimates from the Survey 


The Canadian Labour Force Survey (LFS) was 
developed following the Second World War to satisfy a 
need for reliable and timely data on the labour market. 
Information was urgently required on the massive 
labour market changes involved in the transition from a 
war-time to a peace-time economy. The survey was 
designed to provide estimates of employment by 
industry and occupation at the regional as well as the 
national level. 


A quarterly survey initially, the LFS became a 
monthly survey in 1952. In 1960, the Interdepartmental 
Committee on Unemployment Statistics recommended 
that the LFS be designated the source of the official 
measure of unemployment in Canada. This endorse- 
ment was followed by a demand for a broader range of 
labour market statistics, in particular more detailed 
regional data. The information generated by the survey 
has expanded considerably over the years and now 
provides a rich and detailed picture of the Canadian 
labour market. 


The LFS is the only source of monthly estimates 
of total employment (both full and part time), of self- 
employment (both agricultural and non-agricultural) and 
of total unemployment. It publishes monthly standard 
labour market indicators such as the unemployment 
rate, the employment-to-population ratio, and the 
participation rate. It is a major source of information on 
the personal characteristics of the working-age 
population, including age, marital status, educational 
attainment, and family characteristics. 


Employment estimates include detailed break- 
downs by industry and occupation, job tenure, and 
usual and actual hours worked. The survey incor- 
porates questions permitting analyses of many topical 
issues, such as involuntary part-time employment, 
multiple job-holding, and absence from work. 


Unemployment estimates are produced by in- 
dustry and occupation as well as by duration of unem- 
ployment, type of work sought, and activity before 
looking for work. Some information is also available on 
the recent labour market involvement (i.e. within the 
last five years) of persons not in the labour force. 


In addition to providing national and provincial 
estimates, the Labour Force Survey also releases esti- 
mates for subprovincial areas, such as Economic 
Regions and Census Metropolitan Areas. In recent 
years, estimates of the standard labour market 


Chapitre 1 


Introduction 


1.1. Estimations produites d’apres les résultats de 
l’enqueéte sur la population active 


L’enquéte sur la population active (EPA) a ete creee apres 
la Deuxieme Guerre mondiale suite a un besoin immeédiat de 
données fiables et actuelles portant sur le marche du travail et 
refletant le passage d'une économie de guerre a une 
economie de paix. L’enquéte a été concue dans le but de pro- 
duire des estimations de l'emploi selon la branche d'activite et 
la profession tant au niveau regional que national. 


Trimestrielle a l’origine, l’enquéte sur la population active 
est devenue une enquete mensuelle en 1952. En 1960, le 
Comité interministéeriel de la statistique du chomage a recom- 
mande qu’elle devienne l'instrument officiel par lequel le 
chomage au Canada serait mesure. Apres |’adoption de cette 
recommandation, la demande de donnees a augmente : les 
utilisateurs voulaient disposer d'une plus vaste gamme de sta- 
tistiques sur le marche du travail et en particulier de données 
regionales plus detaillees. L’éventail d’estimations produites 
au moyen des résultats de |l’enquéte s'est elargi considera- 
blement au fil des ans, et représente aujourd’hui un portrait 
etoffé et détaille du marché du travail canadien. 


L’enquete est la seule source d’estimations mensuelles 
de l'emploi total, a plein temps et a temps partiel, de l'emploi 
autonome, dans le secteur agricole et non agricole, et du 
chomage total. A partir de ces résultats, on publie tous les 
mois des indicateurs standard du marche du travail comme le 
taux de chdmage, le ratio de l'emploi a la population et le taux 
d’activite. Il s’agit d'une des principales sources d'information 
sur les caracteristiques personnelles de la population en age 
de travailler (dont l’age, l'état matrimonial, le niveau d’instruc- 
tion et la situation familiale). 


Les estimations de |’emploi sont ventilées a un niveau deé- 
taille selon, notamment, la branche d’activite, la profession, la 
durée d'emploi, le nombre d’heures habituellement travaillées 
et le nombre d’heures reellement travaillees. Certaines des 
questions posées permettent d’étudier une grande variéte de 
sujets d’actualite comme le travail a temps partiel non choisi, 
le cumul d’emplois et l’'absentéisme. 


Les estimations du chomage sont produites par branche 
d’activiteé et par profession ainsi que selon la duree du 
chomage, le genre de travail recherche et l’activité avant la 
recherche de travail. Il existe egalement des données sur 
l’activité recente sur le marche du travail (c.-a-d. au cours des 
cing dernieres années) des personnes actuellement inactives. 


En plus des estimations nationales et provinciales, on 
produit egalement des estimations pour des régions infra- 
provinciales comme les régions economiques et les régions 
metropolitaines de recensement. On a également eu recours, 
ces dernieres années, a des techniques d’estimation spéciales 


indicators have also been tabulated for small areas, 
such as Census Divisions and Federal Electoral 
Districts (FED), using special estimation techniques. 
Such estimates, provided they meet certain minimum 
reliability Constraints, are produced and released on a 
cost-recovery basis. The estimates are used by both 
federal and provincial governments in allocating funds 
and other resources among various political and 
administrative jurisdictions. 


The individual sample records from the LFS are 
availabie on magnetic tape for interested users. The 
tapes include demographic information as well as data 
from the survey questionnaire. In all cases, geographic 
information is suppressed to ensure the confidentiality 
of responding households. The micro records are 
being used increasingly, in conjunction with data from 
supplementary surveys, in micro-simultation models to 
assess the impact of changes in government policy. 
Standard tables and special tabulations can be pro- 
duced in various machine-readable forms, or in print. 
Direct access to a wide range of aggregated informa- 
tion is possible through CANSIM, Statistics Canada’s 
machine-readable database and retrieval system. 


Standard estimates from the LFS are published 
monthly in The Labour Force (Statistics Canada, 
Catalogue 71-001). Seasonally adjusted estimates are 
published for the main characteristics. Requests for 
special tabulations are filled on a cost-recovery basis. 


1.2 An Overview of the Survey 


The LFS, due to operational and conceptual 
problems, excludes from its coverage the Yukon and 
the Northwest Territories, and residents of Indian 
reserves and Crown lands. Also excluded are inmates 
of institutions and full-time members of the Canadian 
Armed Forces since both groups are considered to 
exist outside the labour market. These exclusions 
account for about 2% of the total population of Canada. 


The size of the sample remained more or less 
stable at about 35,000 households per month until the 
early seventies. During 1976-77, it was increased to 
about 55,000 households in order to meet the 
increasing demands for more reliable and detailed data 
at the provincial level. Due to general restraints on 
resources, the LFS has also occasionally experienced 
reductions in its monthly samples. In 1985-86, 
following two such reductions, the sample comprised 
about 48,000 households. 


The LFS follows a rotating panel sample design, in 
which households remain in the sample for six 
consecutive months. The sample is split into six 
representative sub-samples, and each month one-sixth 
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pour calculer les indicateurs standard du marche du travail 
relativement a de petites régions telles les divisions de 
recensement et les circonscriptions électorales fedérales. Ces 
estimations, qui doivent répondre a des criteres de fiabilite de 
base, sont produites selon le principe du recouvrement des 
frais. Le gouvernement fédéral et les gouvernements pro- 
vinciaux s’en servent pour la répartition des ressources finan- 
ciéres et autres entre les diverses competences politiques et 
administratives. 


Les enregistrements relatifs aux personnes ayant fait 
partie de |l’échantillon de |’enquéte sur la population active 
sont conservés sur bande magnétique et sont disponibles 
pour les utilisateurs intéressés. Ces bandes contiennent des 
données démographiques ainsi que les renseignements re- 
cueillis au moyen du questionnaire, mais les données géogra- 
phiques en ont été supprimees afin de proteger |l’anonymat 
des ménages participants. On utilise de plus en plus les 
micro-enregistrements en méme temps que les données 
tirees des enquétes supplémentaires pour evaluer, a l'aide de 
modeles de simulation, incidence qu’auraient certains chan- 
gements siils étaient apportes aux politiques gouvernemen- 
tales. Il est possible de produire sous diverses formes ordino- 
lingues et sur support papier les tableaux standard ainsi que 
des totalisations spéciales. Enfin, les personnes interessees 
ont accés directement a toute une gamme de données 
agrégeées stockées dans le CANSIM, qui est a la fois la base 
de données informatique et le systeme de consultation de 
Statistique Canada. 


Les estimations standard paraissent chaque mois dans la 
publication La population active (Statistique Canada, n° 71-001 
au catalogue). Seules les données relatives aux principales 
caractéristiques sont désaisonnalisées. Des totalisations speé- 
ciales sont produites en recouvrement des couts. 


1.2 Apercu general de l’enquéte 


Pour des raisons d’ordre opérationnel et théorique, les 
residents du Yukon et des Territoires du Nord-Ouest sont 
actuellement exclus du champ de l’enquéte sur la population 
active, de méme que les personnes qui habitent dans des ré- 
serves indiennes et sur les terres de la Couronne, les pen- 
sionnaires d'un etablissement institutionnel et les membres a 
plein temps des Forces armées canadiennes, qui sont consi- 
dérés comme n’étant pas sur le marché du travail. Ces 
personnes représentent environ 2% de la population du 
Canada. 


L’echantillon mensuel, dont la taille s’était maintenue 
autour de 35,000 menages jusqu’au début des années 70, a 
ete porte a environ 55,000 ménages en 1976-1977, car la 
demande de donnees provinciales plus fiables et plus 
detaillees se faisait de plus en plus grande. A cause des 
restrictions qui ont touché l'ensemble des ressources, il a fallu 
le reduire a l'occasion. Suite aux deux réductions effectuées 
en 1985-1986, l’échantillon a été réduit de facon a inclure 
environ 48,000 ménages. 


L’'EPA est une enquéte par panel avec renouvellement de 
'échantillon. Celui-ci est divisé en six sous-échantillons 
representatifs, dont les ménages font partie pendant six mois 
consecutifs. Un de ces sous-échantillons est remplacé chaque 


of the Sample is replaced after it has completed its 
Stay in the sample. This results in a five-sixths month- 
to-month sample overlap, which makes the design effi- 
cient for estimating month-to-month changes. The 
rotation after six months prevents fatigue and undue 
respondent burden for selected households. 


Data collection for the LFS is carried out during 
the week following the reference week, which is 
normally the week containing the fifteenth day of the 
month. About 780 Statistics Canada interviewers from 
eight Regional Operations (RO) centres collect the 
information needed to produce labour force data. This 
iS done through personal interviews in the first month 
and by telephone interviews in subsequent months. 
The questionnaires are completed by the interviewer 
and are sent to the ROs, where data are captured on 
minicomputers, and then transmitted to Ottawa for 
processing. The entire LFS operation of data collection, 
capture, and processing is very tightly monitored and 
controlled. This enables Statistics Canada to publish 
the monthly estimates just three weeks after the 
interview week. 


Due to the importance of the statistics produced 
from the survey and the complexities of the operations 
involved, various quality evaluation and _ control 
programs designed for different phases of the survey 
are monitored regularly. Furthermore, the sample is 
partially updated in between the decennial censuses to 
account for changes in population characteristics and 
distribution. The sample is also completely redesigned 
following each decennial census. The latest newly 
designed sample was introduced in 1985. The earlier 
sample design and objectives of the redesign, 
including the main features of the new sample, are 
outlined briefly below. 


1.3 Sample Design Prior to 1985 


The salient features of the design used until the 
redesigned sample was introduced in 1985 are 
described here to provide a context for the discussion 
of the design features in the main chapters. Each of 
Canada’s ten provinces was divided into several LFS 
Economic Regions (ERs), which served as the primary 
level of stratification. Within each ER the next level of 
stratification was the designation of areas as Self 
Representing (SR) and Non-Self Representing (NSR). 
The SR areas corresponded to urban areas that were 
large enough to yield an expected sample of 20 
dwellings. The rural areas and smaller urban centres 
made up the NSR areas. 


Large cities in the SR areas were further stratified 
by grouping together contiguous Census Tracts without 
any regard to optimality of characteristics. Normally, 
six clusters, corresponding usually to city blocks, were 
then selected from each stratum using the Rao, Hartley 
and Cochran (1962) random group method. In addition 
to this area frame, an open-ended list frame of 
apartments was maintained in the larger cities. 


mois, les ménages qui le constituaient ayant fini de participer 
a l’enquéte. Aijnsi, les cing sixieémes de |'échantillon ne 
changent pas d’un mois a l'autre, ce qui permet de mesurer 
les variations mensuelles. Par ailleurs, le fait que les menages 
sélectionnés sortent de |l’échantillon au bout de six mois 
signifie qu’ils n'ont pas le temps de se lasser d’en faire partie 
et que le fardeau de reponse n'est pas trop lourd. 


La collecte des données de |’EPA est faite pendant la 
semaine suivant la semaine de référence, qui est norma- 
lement celle pendant laquelle tombe le quinzieme jour du 
mois. Environ 780 intervieweurs de Statistique Canada, ratta- 
ches a huit bureaux régionaux (BR), recueillent les rensei- 
gnements nécessaires a la production des données sur la 
population active. Pour ce faire, ils interviewent chaque me- 
nage de |’éechantillon, sur place le premier mois qu'un menage 
participe a l'enquéte et par telephone les mois suivants. Les 
questionnaires remplis par les intervieweurs sont expedies aux 
BR ou les données sont introduites dans des mini-ordinateurs 
puis transmises a Ottawa en vue de leur traitement. Tous les 
aspects des operations de collecte, de saisie et de traitement 
des données de |'EPA sont suivis et contrdlés de trés pres 
afin que Statistique Canada puisse publier les estimations 
mensuelles trois semaines a peine apres la semaine 
d’enquéte. 


Etant donnée |l’importance des statistiques produites au 
moyen de cette enquéte et la complexite des operations en 
cause, chacune des etapes est soumise regulierement a 
divers programmes d’évaluation et de controle de la quailite. 
De plus, l’échantillon est partiellement mis a jour entre les 
recensements décennaux pour tenir compte de |'evolution des 
caractéristiques et de la distribution de la population et il est 
entierement remanieé apres chacun de ces recensements. 
L’echantillon preleve selon le nouveau plan de sondage a ete 
introduit en 1985. Le plan anterieur et les objectifs du rema- 
niement ainsi que les principales caractéristiques du nouvel 
echantillon sont déecrits brievement ci-apres. 


1.3. Plan de sondage avant 1985 


Les principales caractéristiques du plan de sondage 
utilise jusqu’a lintroduction du plan actuel en 1985 sont 
décrites ici pour fin de comparaisons avec les nouvelles 
caractéristiques du plan actuel qui seront déecrites dans les 
chapitres suivants. Chacune des dix provinces du Canada etait 
divisee en un certain nombre de régions economiques (RE) 
de l'EPA, qui constituaient les strates primaires. Le niveau de 
stratification suivant etait la repartition des secteurs qui com- 
posaient chaque RE en secteurs autorepresentatifs (AR) et en 
secteurs non autorepresentatifs (NAR). Les secteurs autore- 
presentatifs étaient les regions urbaines suffisamment grandes 
pour que le rendement de |’echantillon y soit de 20 meénages. 
Les secteurs non autorepresentatifs etaient formes de regions 
rurales et de centres urbains plus petits. 


Les grandes villes situees dans les secteurs autore- 
presentatifs etaient subdivisees, sans souci d’optimalite, en 
sous-unites constituees de secteurs de recensement contigus. 
Normalement, six grappes, correspondant en general a des 
ilots, etaient ensuite choisies dans chaque sous-unite par la 
methode des groupes aléatoires de Rao, Hartley et Cochran 
(1962). Outre cette base areolaire, il existait pour les grandes 
villes une base constituee de listes ouvertes d'immeubles 
d’'appartements. 


The advantages of the selection method used for 
SR areas were the flexibility it allowed for changes in 
the sample size (Singh and Drew, 1977) and _ for 
updating the sample (Keyfitz, 1951; Platek and Singh, 
1977; Drew, Choudhry and Gray, 1978). Sample 
updating was required in SR areas in order to maintain 
sampling variances at desired levels by periodically 
adjusting the sample to reflect uneven population 
growth. 


In the NSR areas, stratification based on industry 
classification was carried out within each Economic 
Region, subject to the condition that strata should be 
contiguous land areas. Within strata, Primary Sampling 
Units (PSUs) were delineated such that each PSU 
represented its stratum with respect to the rural to 
urban population ratio and important labour force 
characteristics. Although the rural portions of the PSU 
were made contiguous by grouping neighbouring rural 
Enumeration Areas, contiguity of urban portions could 
not always be attained due to the restriction placed on 
maintaining the rural to urban population ratio. 
Frequently, larger urban centres had to be shared 
among several PSUs within a stratum. 


Two or more PSUs were selected from each 
stratum using the randomized probability proportional 
to size (PPS) systematic sampling method (Hartley and 
Rao, 1962). Within each selected PSU, the urban and 
rural portions were sampled independently. In the 
urban portion of the selected PSU, a two stage sample 
of clusters and dwellings was selected. In the rural 
portion a three stage design was used: secondary 
sampling units (consisting of Census Enumeration 
Areas or combinations), followed by clusters (identifia- 
ble land areas with up to 20 dwellings) and then 
dwellings as the final sampling units. Except for the 
last stage, randomized PPS systematic sampling was 
used in the selections. The last stage units, namely 
dwellings, were selected systematically in both SR and 
NSR areas. 


Following a personal interview in the first month in 
the sample, telephone interviewing was the normal 
method of data collection for households in their 
second to sixth month in SR areas. In the NSR areas, 
however, all interviewing was carried out in person due 
to concerns about public acceptance of telephone 
interviewing in rural areas, particularly in the light of 
party lines. 


1.4 Objectives of the Redesign 


Following each decennial population census, the 
Canadian Labour Force Survey has undergone a 
sample redesign to reflect changes in population 
characteristics and to respond to changes in the 
information needs to be satisfied by the survey. The 
current redesign program culminated with the intro- 
duction of a new sample at the beginning of 1985. The 
program included extensive consultation involving the 


L’avantage que présentait la méthode de selection utilisee 
pour les secteurs AR était sa souplesse lorsqu’il fallait 
modifier la taille de |'échantillon (Singh et Drew 1977) et 
mettre celui-ci a jour (Keyfitz 1951, Platek et Singh 1977 et 
Drew, Choudhry et Gray 1978). II fallait tenir l'echantillon a 
jour dans les secteurs AR pour maintenir les variances 
d’échantillonnage aux niveaux voulus, ce qui etait fait en 
rajustant périodiquement |’échantillon pour tenir compte de la 
croissance inegale de la population. 


Dans les secteurs NAR, la stratification etait faite a 
l'intérieur de chaque région économique en fonction de la 
répartition des activités economiques, mais il fallait que les 
strates soient des superficies contigués. Dans chaque strate, 
les unités primaires d’échantillonnage (UPE) devaient etre 
délimitées de telle maniére que chaque UPE soit represen- 
tative de sa strate du point de vue du ratio de la population 
rurale a la population urbaine et de certaines caracteristiques 
importantes de la population active. Il etait possible de faire 
en sorte que les parties rurales des UPE soient contigues en 
groupant des secteurs de dénombrement voisins, mais ce but 
ne pouvait pas toujours étre atteint avec les centres urbains, 
vu la nécessité de maintenir le ratio de la population rurale a 
la population urbaine. On a souvent du repartir les grands 
centres urbains entre plusieurs UPE d’une meme strate. 


Deux UPE ou plus étaient choisies dans chaque strate par 
la méthode d’échantillonnage systematique avec classement 
aléatoire et probabilité proportionnelle a la taille (Harltey et 
Rao 1962). Les parties urbaines et rurales de chaque UPE 
choisie étaient échantillonnées séparement. Dans la partie 
urbaine des UPE, on s'est servi d’un plan d’échantillonnage a 
deux degrés pour choisir les grappes et les logements. Dans 
la partie rurale, on a appliqué un plan d’échantillonnage a trois 
degrés pour les unités secondaires, c’est a dire pour prelever 
les secteurs de dénombrement du recensement ou groupes 
de tels secteurs, les grappes (en l’occurrence, des superficies 
habitées par un maximum de 20 meénages) et les logements 
(derniéres unités d’échantillonnage). Exception faite de la 
derniere étape, |’échantillon a été prélevé par la méthode 
d’échantillonnage systematique avec classement aléatoire et 
probabilité proportionnelle a la taille. Tant dans les secteurs 
AR que NAR, on a eu recours a |’échantillonnage systéma- 
tique pour les dernieres unites, soit les logements. 


Pour la collecte des données, la méthode normale con- 
sistait a faire des interviews teléphoniques auprés des 
menages dans les secteurs AR du deuxiéme au sixieéme mois 
ou ceux-ci participaient a l’enquéte, tandis que dans les 
secteurs NAR toutes les interviews étaient faites sur place, la 
population des regions rurales étant généralement moins 
favorable aux interviews telephoniques, surtout compte tenu 
du fait que dans beaucoup d’endroits les lignes télephoniques 
sont partagées par plusieurs abonnés. 


1.4 Objectifs du remaniement 


Apres chaque recensement décennal de la population, on 
remanie le plan de sondage de |l’enquéte sur la population 
active du Canada pour tenir compte de |'évolution des 
caracteéristiques de la population et des besoins en information 
que cette enquéte cherche a satisfaire. Le dernier programme 
de remaniement a abouti a l’introduction d’un nouvel échan- 
tillon au début de l'année 1985. Dans le cadre de ce 
programme, on a procédé a des consultations poussées visant 


reassessment not only of the survey’s principal role as 
a provider of current labour market information, but 
also of its use as a central vehicle for conducting 
household surveys within Statistics Canada. The 
following three objectives were established for the 
sample redesign: 


(i) Improved subprovincial labour market data. 


This objective was established in consultation with the 
Statistical focal points within each of Canada’s ten 
provinces, and with key federal user departments, 
through annual federal/ provincial conferences on 
labour statistics and bilateral follow-ups. In general, 
these consultations revealed satisfaction with data 
reliability for provincial and national data, as well as a 
strong desire for improved subprovincial data. Specific 
data reliability requirements adopted for the 
redesigned sample were as follows: 


(a) for Canada and each of the ten provinces: no 
reduction in current reliability for monthly esti- 
mates of level and estimates of month-to-month 
change in total employment and unemployment. 


(60) for the 24 Census Metropolitan Areas as defined 
by the 1981 Census: monthly estimates of 
unemployed with coefficients of variations (CVs) of 
20% or less. 


(c) for 66 subprovincial Economic Regions defined in 
consultation with the provinces: monthly estimates 
of unemployed with CVs of 25% or less. 


(d) for cities with a population of 60,000 or more in 
Quebec and Ontario, and 25,000 or more in the 
remaining provinces: quarterly estimates of un- 
employed with CVs of 25% or less. 


(ii) Enhance the LFS as a general vehicle for the 
conduct of household surveys. 


During the revision of the LFS in the 1970s, changes 
were made to the survey operations and systems that 
expanded the capacity for other household surveys to 
use the existing LFS infrastructure. In the ensuing 
decade both the number and diversity of such surveys 
increased substantially. This objective related to 
explicitly taking account of such general applications in 
the survey design, for example, by making the 
stratification less labour force specific. 


(iii) Improve the cost-efficiency of the survey 
design. 


From the cost-efficiency perspective, the potential was 
recognized for major savings if the telephone inte- 
viewing procedure followed in SR areas could be 
extended to NSR areas. In parallel with the investi- 
gation of more telephoning, it was decided that sample 
design parameters (such as the number of stages of 
sampling and the allocation of the sample to stages) 
should be re-optimized, particularly in NSR areas. 


a reévaluer non seulement le contrdle principal de |’enquéte, 
c'est-a-dire de permettre la production de données actuelles 
sur le marche du travail, mais aussi l'utilisation qui en est faite 
a Statistique Canada comme principal moyen pour effectuer 
les enquétes-meénages. Le remaniement du plan de sondage 
avait les trois grands objectifs suivants : 


(i) Améliorer les données infraprovinciales sur le 
marche du travail 


Cet objectif a été etabli a la suite de consultations aupres des 
points de contact dans les dix provinces canadiennes et des 
principaux ministeres et organismes fédéraux utilisateurs, 
dans le cadre des Conferences féderales-provinciales sur la 
Statistique du travail et d’echanges bilateraux subseéquents. Il 
est ressorti de ces consultations que les personnes inte- 
ressees étaient generalement satisfaites des données provin- 
ciales et nationales sur le plan de la fiabiliteé, mais qu’elles 
souhaitaient fortement que les données infraprovinciales 
soient ameliorees. Le nouveau plan de sondage devait donc 
remplir les conditions suivantes a cet egard : 


a) Pour le Canada et les dix provinces, permettre de 
maintenir le degre de fiabilite des estimations mensuelles 
du niveau de l'emploi et du chomage et des estimations 
de la variation mensuelle de ce niveau. 


b) Pour les 24 régions métropolitaines de recensement telles 
que définies pour le recensement de 1981, permettre de 
produire des estimations mensuelles du chomage dont le 
coefficient de variation (CV) ne depasserait pas 20%. 


c) Pour 66 régions économiques a l’intérieur des provinces 
choisies avec l'accord de ces dernieres, permettre de 
produire des estimations mensuelles du chomage dont le 
CV ne depasserait pas 25%. 


d) Pour les villes de 60,000 habitants ou plus du Quebec et 
de I’Ontario et de 25,000 habitants ou plus des autres pro- 
vinces, permettre de produire des estimations trimes- 
trielles du chomage dont le CV ne deépasserait pas 25%. 


(ii) Faire de ?EPA un meilleur outil pour la realisation 
d’enquétes-menages. 


Lors de la revision de |'EPA dans les années 70, on a apporte 
des modifications aux operations d’enquéte et aux systemes 
informatiques afin de permettre a un plus grand nombre 
d’enquétes-menages d'utiliser l’infrastructure en place. Le 
nombre et la variete de ces enquétes se sont accrus de facon 
considérable pendant les dix années qui ont suivi. Cet objectif 
signifiait qu'on tiendrait compte, au moment du remaniement 
du plan de sondage, des applications generales qui en 
seraient faites, en faisant en sorte, par exemple, que la strati- 
fication n’ait pas comme unique critere les caractéristiques de 
la population active. 


(iii) Rendre le plan de sondage plus économique. 


Il a ete reconnu que de grandes economies pourraient étre 
realisees si la methode de collecte des donnees par interview 
telephonique utiliseée dans les secteurs AR était appliquee 
dans les secteurs NAR. Parallelement a |’'etude de cette ques- 
tion, il a ete decide qu'il faudrait optimiser de nouveau les 
parametres du plan de sondage comme le nombre de degres 
d’échantillonnage et la repartition de l’echantillon selon le 
degre, particulierement dans les secteurs NAR. 


1.5 Scope of the Report 


This report is intended to be a reference source on 
the methodological and operational aspects of the LFS 
and is aimed at program planners, large scale survey 
designers and managers, analytic users, researchers 
and consultants. The survey design and methodology 
are discussed in detail with supplementary references 
indicated where appropriate. To complement this 
description of the survey mechanism a separate report 
entitled ‘Guide to Labour Force Survey Data’, with 
emphasis on subject matter aspects and the data is 
available from the LFS has been prepared. The sample 
design and various operational procedures described 
in different chapters of this report are as of January 
1985, except for Estimation Methodology in Chapter 8 
and developmental programs discussed in the last 
chapter. In these cases the report includes changes 
stemming from ongoing research activities in search of 
more cost effective data collection methods and better 
estimation techniques that were incorporated as late as 
1988-89, i.e. until the finalization of this report. 


There are ten additional chapters in this report. 
Chapter 2 describes various levels of stratification, 
choice of stratification variables and corresponding 
algorithms, and the stratification system adopted in the 
Self Representing and Non-Self Representing areas of 
an Economic Region. 


Chapters 3 and 4 discuss in detail the design 
considerations in the Self Representing and Non-Self 
Representing areas respectively including the choice 
and formation of sampling units at different stages of 
selection, the sampling methods adopted, and the 
methods of updating the sample. 


Rotation of the sample occurs at each stage of the 
multistage design used in the LFS. Chapter 5 describes 
the method used in the allocation of the overall sample 
to the various provinces and subprovincial areas. 
Chapter 6 explains how this rotation (replacement of 
units) is accomplished in an unbiased manner, taking 
into account the cost of rotation and the response 
burden. 


Chapter 7 identifies the role of various divisions 
involved in the interdisciplinary environment governing 
the overall operation of the LFS. It also presents an 
overall picture of the operations involved in a typical 
survey month by describing the operational aspects of 
sampling, data collection, and major steps in data 
processing and dissemination. 


Chapter 8 describes the new estimation and 
variance estimation methodology introduced in 1988- 
89 as a result of research work undertaken after the 
introduction of the new sample in 1985. The new 
estimation method, which uses a regression approach, 
was found to be at least as good as the raking ratio 


1.5 Objet de la publication 


Cette publication se veut un ouvrage de reference sur la 
meéthodologie et les opérations de |'EPA et elle s'adresse aux 
planificateurs de programmes, aux personnes qul concoivent 
de grandes enquétes ainsi qu’a celles chargées de leur 
réalisation, aux utilisateurs des données a des fins d’analyse, 
aux chercheurs et aux conseillers. Le plan et la meéthodologie 
de l’enquéte sont traités en detail et le lecteur est renvoye a 
des documents de référence supplementaires au besoin. Un 
document distinct intitulé "Guide des donnees de l'enquete 
sur la population active" complete la description du fonction- 
nement de |’enquéte présentée ici; l’'accent y est mis sur les 
concepts et définitions et sur les données produites dans le 
cadre de I'EPA. Le plan de sondage et les procedures 
opérationnelles décrites dans les differents chapitres datent de 
janvier 1985 a l'exception de la methodologie d’estimation 
présentée au chapitre 7 et des programmes de developpe- 
ment dont il est question au dernier chapitre. II s'agit la de 
modifications découlant des travaux de recherche qui se font 
continuellement pour trouver des meéthodes de collecte de 
données plus economiques et des techniques d’estimation 
plus efficaces. Certaines de ces modifications ont ete appor- 
tées aussi tard qu’en 1988-1989, alors qu'on mettait la 
derniere main au manuscrit. 


Cette publication contient onze chapitres. Le chapitre 2 
décrit les divers niveaux de stratification, le choix des varia- 
bles de stratification et les algorithmes qui s’'yrapportent ainsi 
que le systeme de stratification adopte pour les secteurs auto- 
representatifs et non autorepresentatifs d’une region econo- 
mique. 


Les chapitres 3 et 4 traitent en détail des facteurs qui sont 
intervenus dans |’élaboration du plan de sondage en ce qui a 
trait aux secteurs autorepresentatifs et non autorepresentatifs 
respectivement, notamment le choix et la formation des unites 
aux differents degrés d’echantillonnage ainsi que les 
meéthodes d’échantillonnage et de mise a jour de |’échantillon 
adoptees. 


Le renouvellement de |’échantillon est effectue a chaque 
etape du processus d’echantillonnage a plusieurs degrés de 
EPA. Au chapitre 5, nous deécrivons la méthode par laquelle 
l'echantillon global est réparti entre les provinces et régions 
infraprovinciales et, au chapitre 6, nous expliquons comment 
le renouvellement (le remplacement des unites) est réalisé 
sans risque de biais et en tenant compte du cot de cette 
operation et du fardeau de réponse. 


Au chapitre 7, nous indiquons le role joué par les diverses 
divisions qui constituent le contexte interdisciplinaire dans 
lequel les operations de |'EPA sont accomplies. Nous donnons 
également une vue d’ensemble des opérations effectuées 
pendant un mois d’enquéte typique, c’est-a-dire que nous 
décrivons les aspects opérationnels de l'echantillonnage, de la 
collecte des données et des principales étapes du traitement 
et de la diffusion des données. 


Au chapitre 8, nous décrivons les nouvelles méthodes 
d’estimation et d’estimation de la variance introduites en 1988- 
1989 a la suite des travaux de recherches entrepris apres 
l'adoption du nouveau plan en 1985. On a trouvé que, en ce 
qui concerne les caractéristiques de la population active, la 
nouvelle methode, fondée sur l’analyse de la régression, est 


method for the Labour Force (LF) characteristics and at 
the same time achieved the desired consistency 
among individual and family related statistics. The 
raking ratio method of estimation and the 
corresponding variance estimation technique used 
between 1984-85 and 1988-89 are also briefly 
described. 


Important quality measures and quality monitoring 
and evaluation programs for the LFS are discussed in 
Chapter 9. Chapter 10 briefly describes the use of the 
LFS as a central vehicle for general application to other 
household surveys. 


Chapter 11 describes some of the research 
initiatives underway at the time this report was 
prepared in order to find ways of responding to 
changing demands for data and to take advantage of 
new technology in data collection and processing. 
Several appendices, each dealing with a special topic, 
and other survey materials, are included at the end. 


au moins aussi bonne que la methode iterative du quotient et 
qu'elle permet en méme temps d’obtenir le degre de 
cohérence voulu entre les statistiques ayant trait aux individus 
et celles se rapportant a la famille. La methode du quotient et 
la technique d’estimation de la variance correspondante uti- 
lisees entre 1984-1985 et 1988-1989 sont décrites brievement. 


Les mesures et les programmes importants de verification 
et d’évaluation de la qualité appliques a |’EPA sont decrits au 
chapitre 9. Au chapitre 10, nous parlons brievement de la 
maniere dont on se sert de |’EPA pour realiser d'autres 
enquétes-meénages. 


Le chapitre 11 porte sur les travaux de recherche en 
cours au moment de la redaction du present ouvrage. Ceux-ci 
visent a trouver des moyens de reagir face a |’evoiution de la 
demande de données et d’appliquer les nouvelles technolo- 
gies a la collecte et au traitement des données. Les annexes, 
dont chacune traite d'un sujet particulier, et les autres 
documents d’enquéte sont inclus a la fin de la publication. 


a. Sw each <a is _-. 


a Sane ar eee eo 


a a — ee 
Ny ot mt als 


Tig or beer A 
Cates Teenie - 
14.4 «218% 
ee ee ¢ : ’ 
oF PU ger ee 


e ; 


- vv pay - 
wr r. 
| L vi 
wt 7% us re 
eG a, a > P) ‘ae 9 
ender oa als: a are ws 
aoa e | au a Oe - eo See wee 
) [seed Sys ee 
s ay " AST a eA . 


a ae ‘ 
CADP wtp FrA@ 
Oe ee ee 


ah pete: A sw 
= ~ pee aw hy 
Karte a ~ 


a vo 8 ie «& 
ory ie Dp tneaia: ) e- 
an (ort og 1 lw 
ry ot oan! See.) 


° an 7a 
-~F ' 
ra sf uf 
Te Wade halt 
: mi 
7 mas] 
4 = 
sé a? - he 
—_ Se. Pele the Roh 
- iy aaelyah) 
vsti Se pa a ae 
mat 3 : en” Bhe- 
» 
= > ene A ‘ im, oA i 


Chapter 2 
Stratification 


PAA| Introduction 


In the design of sample surveys, stratification 
refers to the process of partitioning the sampling frame 
into subsets called strata, each of which are sampled 
separately. Stratification is usually carried out in such a 
way as to reduce the variability of the estimates of 
population characteristics. This is done by grouping 
together units which are homogenous with respect to 
the population characteristics of interest. Another 
advantage of stratification is that, depending upon the 
information available, sampling and estimation proce- 
dures may differ from stratum to stratum. Further, in a 
continuous survey like the Labour Force Survey, 
Stratification provides the added flexibility of updating 
or redesigning the sample in a specified stratum or 
group of strata, without affecting the design in the 
remaining strata. 


Each of the ten provinces of Canada is divided into 
a number of LFS Economic Regions. Economic 
Regions were originally established by the Department 
of National Defense in the 1950s as subprovincial 
areas of similar economic structure. Since the LFS 
design introduced after the 1961 Census, Economic 
Regions have been used as primary strata. Initially this 
was done to ensure better geographical representation 
of the sample within provinces, and estimates were 
published only for provinces or groups of provinces. 
But, since the increase in the size of the LFS sample 
during the late 1970s, estimates have been published 
for individual or groups of Economic Regions. Since 
their availability, estimates at the Economic Region 
level have been used extensively by the provinces and 
by federal government departments; for example, 
Employment and Immigration Canada, uses them in 
the administration of the Unemployment Insurance Act. 


As a result of the increased use of estimates at the 
Economic Region level, a good deal of consultation 
took place during the initial stages of the current 
sample redesign, with the provinces and with federal 
government departments regarding the choice of 
Economic Region boundaries for the sample. These 
discussions led to the adoption of completely new 
Economic Region boundaries for Ontario, Quebec and 
Alberta: there were little or no changes in the other 
provinces. Maps and descriptions of Economic Region 
boundaries for each province are given in Appendix E. 


Within Economic Regions, the next level of 
stratification is the designation of areas as Self 
Representing (SR) or Non-Self Representing 
(NSR). 


Chapitre 2 
Stratification 


2.1 Introduction 


Dans le plan des enquétes par sondage, la stratification 
est le processus qui consiste a diviser la base de sondage en 
sous-ensembles appeles des strates, dont chacune est echan- 
tillonnee séparement. On procede habituellement a la stratifi- 
cation de maniére a réduire la variabilité des estimations 
relatives aux caracteristiques de la population, c’est-a-dire en 
groupant dans une méme strate les unites qui sont homo- 
genes du point de vue des caracteéristiques-clés. La strati- 
fication presente d'autres avantages, dont celui de permettre 
de varier la methode d’échantillonnage et d’estimation d'une 
strate a l'autre en fonction des renseignements disponibles. 
En outre, pour une enquéete permanente comme |'EPA, la 
stratification permet de mettre |’echantillon a jour ou de 
remanier le plan de sondage d’une strate donnee ou de 
plusieurs groupes de strates sans toucher au plan de sondage 
des autres strates. 


Chacune des dix provinces canadiennes est divisée en un 
certain nombre de regions economiques de |’EPA. A I'origine, 
lorsque les regions economiques avaient été établies par le 
ministere de la Défense nationale dans les années 50, il 
s’agissait de secteurs infraprovinciaux de structure econo- 
mique semblable. Au remaniement du plan de sondage de 
EPA qui a suivi le recensement de 1961, les regions econo- 
miques sont devenues les strates primaires. Ce changement 
a ete apporte au depart pour assurer une meilleure représen- 
tation geographique de |’echantillon dans les provinces, les 
estimations publi¢es a l’epoque ne se rapportant qu’aux 
provinces et groupes de provinces. Mais depuis que la taille 
de l’échantillon a ete agrandie a la fin des années 70, il a ete 
possible de publier des estimations au niveau des regions 
economiques individuelles ou regroupees. Maintenant que ces 
données existent, les provinces et les ministeres et orga- 
nismes fédéraux s'en servent enormement; Emploi et Immi- 
gration Canada, par exemple, s’en sert pour appliquer la Loi 
sur l’assurance-chomage. 


Compte tenu de cette forte utilisation des estimations 
relatives aux regions economiques par les provinces et les 
ministeres et organismes federaux, ceux-ci ont ete amplement 
consultes pendant les etapes initiales du remaniement du plan 
de sondage au sujet des limites a adopter pour les regions 
economiques. Ces consultations consultations ont abouti a un 
decoupage totalement nouveau pour le Québec, |'Ontario et 
|'Alberta, mais a peu ou pas de changement dans le reste du 
pays. L’annexe C contient des cartes, accompagneées d’expli- 
cations, qui illustrent les regions economiques constituees 
dans chaque province. 


Le niveau de stratification suivant a consisté a déterminer 
quels secteurs dans les regions economiques étaient autore- 
presentatifs et lesquels etaient non autoreprésentatifs. 


The SR areas correspond to urban areas 
sufficiently large to yield a sample of at least fifty 
dwellings, the minimum felt acceptable for an 
interviewer's assignment. Due to the importance 
placed on improved reliability of data for smaller 
Economic Regions in the redesign of the survey, 
sampling rates, and hence the minimum sizes for 
urban areas to be classified as SR, differed from one 
Economic Region to the next. 


The rural areas and smaller urban centres not 
qualifying as SR comprise the NSR areas. Within both 
the NSR and SR portions of Economic Regions, a type 
of optimal stratification was carried out. Because the 
LFS is used not only to provide information on labour 
force characteristics but also as a general vehicle for 
various other household surveys, one of the principal 
objectives of the redesign was to increase the flexibility 
of the LFS for general applications. Stratification was 
considered a means of improving efficiency for general 
applications (as well as for variables of particular 
interest to the LFS) through the application of more 
rigorous procedures than those used in the old design. 


Drawing upon findings of studies carried out at the 
United States Bureau of the Census in the redesign of 


its Current Population Survey, Statistics Canada 
decided to use a _non-hierarchical, multivariate 
clustering algorithm for — stratification, originally 


proposed by Friedman and Rubin (1967). The basic 
algorithm was modified to permit formation of compact 
and contiguous strata, and also to permit delineation of 
heterogeneous but geographically compact Primary 
Sampling Units (PSUs) within NSR strata. 


In addition to the delineation of more statistically 
efficient strata and NSR Primary Sampling Units, the 
automated system resulted in considerable savings in 
both the human resources and time required to 
complete these steps. PSU delineation, in particular, 
had been a time-consuming step when done manually 
during earlier redesigns. 


Section 2 discusses the stratification algorithm and 
considerations leading to the choice of stratification 
variables. Section 2.3 describes the stratification 
adopted in SR areas. For NSR areas, both the 
stratification and delineation of PSUs are discussed 
together in section 2.4 due to the similarity of the two 
operations. More details on the stratification algorithm 
and studies to evaluate the stratification adopted for 
the redesigned sample can be found in Drew, Belanger 
and Foy (1985). 


Les secteurs autoreprésentatifs (AR) sont des regions 
urbaines suffisamment grandes pour que le rendement de 
'échantillon y soit d’au moins cinquante menages, ce qui 
constitue le nombre minimum de meénages a confier a un 
intervieweur. Comme on tenait beaucoup a profiter du rema- 
niement du plan de sondage pour augmenter la fiabilite des 
données sur les petites regions economiques, on a varie d'une 
région économique a une autre les fractions de sondage et 
par conséquent les seuils de taille minimum pour qu une 
région urbaine soit considérée comme un secteur auto- 
representatif. 


Les secteurs non autoreprésentatifs (NAR) sont composes 
des régions rurales et des centres urbains trop petits pour étre 
comptés parmi les secteurs autorepresentatifs. Tant dans les 
secteurs AR que dans les secteurs NAR des regions econo- 
miques, on a procédé a une stratification optimale. Comme 
on ne se sert pas seulement de |’EPA pour produire des don- 
nées sur les caractéristiques de la population active, mais 
aussi pour réaliser d'autres enquétes-menages, un des prin- 
cipaux objectifs du remaniement du plan de sondage était de 
faire en sorte que |'EPA puisse se préter plus facilement a des 
applications générales. On a pensé qu’en appliquant des 
meéthodes plus rigoureuses que dans |’ancien plan on pourrait 
se servir de la stratification pour augmenter l'efficacite de 
l'echantillonnage a la fois pour les applications générales et 
pour les variables qui intéressent particulierement |'EPA. 


En se basant sur les résultats d'études effectuées par le 
United States Bureau of the Census en vue de la refonte de la 
Current Population Survey (enquéte sur la population actuelle), 
on a deécidé d'utiliser un algorithme de classification non 
hiérarchique et multidimensionnel proposé a l’origine par 
Friedman et Rubin (1967) a des fins de stratification. L’algo- 
rithme de base a eté modifié afin de permettre la formation de 
strates compactes et contigués et aussi d’unites primaires 
d’échantillonnage (UPE) hetérogenes mais geographiquement 
compactes dans les strates non autoreprésentatives. 


Non seulement le systeme automatisé permet-il de créer 
des strates et des UPE NAR plus efficaces du point de vue 
statistique, mais en plus il a entrainé des economies consi- 
dérables sur le plan des ressources humaines et du temps 
requis pour accomplir cette tache. La délimitation des UPE en 
particulier prenait beaucoup de temps lorsqu’elle était faite a 
la main, selon les plans de sondage antérieurs. 


A la section 2, il sera question de l’algorithme de 
Stratification et des raisons qui ont motivé le choix des 
variables de stratification. La section 3 décrit la stratification 
adoptee dans les secteurs AR. Pour ce qui est des secteurs 
NAR, la stratification et la délimitation des UPE sont toutes 
deux traitées a la section 4 du fait que les deux opérations se 
ressemblent. Le lecteur trouvera plus de renseignements sur 
les algorithmes de stratification et sur les études d’évaluation 
de la stratification adoptée dans le nouveau plan de sondage 
dans l'article de Drew, Bélanger et Foy (1985) 


2.2 Stratification Algorithm 


The algorithm is designed to partition the units into 
groups (strata) that are as homogeneous as possible 
for several variables of interest, by minimizing the 


weighted sums of the squares for sampling with PPS 
within each group. 


The objective function to be minimized is SW, the 
within-group sum of squares (SW,) weighted for all p 
variables, /=1, 2, ..., p, that is, 


Pp 
SW = )) w, SW, 


i=1 


The weighted between-group sum of squares (SB) 
and the weighted total sum of squares (ST) are 
defined similarly, such that 


ST = SW + SB 


and 


ST; — SW; + SB;. 


Note that SW,, SB, and ST, are defined for the 
sampling with probability proportional to size. Further, 
the stratification index for variable i, is defined as 

SB; 
l; — —, I = 2; seey De 
ST; 


i 


A high index value indicates a good stratification 
(clustering). 


One way of identifying the best clustering would 
be to generate all the possible partitions of N-units into 
L-groups and then simply select the one that 
minimizes the objective function SW. This approach is 
rarely feasible because the number of possible 
partitions may be unmanageably large. 


The Friedman and Rubin (1967) algorithm begins 
with any partition of the N-units into L-groups. In an 
iteration of the algorithm, each unit is examined in turn 
and assigned to the group (including its current group), 
which results in the lowest value for the objective 
function. After several iterations, the algorithm reaches 
a point at which no move of a single unit will produce a 
reduction in the objective function. This point is 
described as a local minimum of the objective function 
because it is dependent on the starting partition. 
Another starting partition might have achieved an even 
lower value of the objective function. Multiple random 
starting points (30 per stratum) were used to move 
beyond local minima. 


Previous LFS sample designs used strata com- 
posed of contiguous geographic units; that ts, each unit 
in a given stratum had to be touching at least one other 
unit in the same stratum. One reason was the 
assumption that such strata would retain the efficiency 
of the sample design for a longer period of time than 
would strata made up of non-contiguous units. 


2.2 Algorithme de stratification 


L’algorithme a pour objet de partitionner les unites en 
groupes (strates) aussi homogenes que possible du point de 
vue d’un certain nombre de variables-cles en minimisant les 
sommes des carrés pondérées pour |'échantillonnage avec 
PPT dans chaque groupe. 


La fonction objective devant étre minimiseée est SW, la 
somme des carrés intraclasse (SW,) ponderee pour toutes les 
variables p, /=1, 2, ..., p, c’est-a-dire 


SW = yt w;, SW, 


i=1 


La somme des carres interclasse pondérée (SB) et la 
somme totale des carres ponderée (ST) sont définies de facon 
semblable, de telle sorte que 


ST = SW + SB 


et 


ST; = SW; + SB,. 


Noter que SW,, SB, et ST, sont definies pour |’echan- 
tillonnage avec probabilite proportionnelle a la taille. De plus, 
l'indice de stratification pour la variable i est défini 

SB; 
[i os 
ST; 
denote une bonne _ stratification 


Un indice éleve 


(homogeéneite). 


Pour obtenir la meilleure classification automatique, on 
pourrait générer toutes les partitions possibles de N-unités en 
L-groupes et simplement choisir celle qui minimise la fonction 
objectif SW. Ceci est rarement realisable parce que le nombre 
de partitions possibles peut atteindre un ordre de grandeur 
excessif. 


L’algorithme de Friedman et Rubin (1967) est un algo- 
rithme heuristique qui commence par une repartition de 
N-unités L-groupes, choisis au hasard. A chaque iteration de 
l'algorithme, chaque unite est examinee a tour de role et 
attribuee au groupe (y compris le groupe dont elle fait partie) 
qui permet d’obtenir la fonction objective a valeur minimum. 
Apres plusieurs iterations, on atteint un point ou aucun dépla- 
cement d’unite ne reduit la fonction objective. Ce point est 
décrit comme étant le minimum local de la fonction objective 
parce qu'il depend de la partition initiale. Un autre mode de 
repartition initiale aurait peut-etre permis d’atteindre une 
fonction objective de valeur encore plus faible. On a pris 
plusieurs points de départ aléatoires (30 par strates) pour 
trouver un des minimum locaux les plus faibles. 


Dans les plans de sondage antérieurs de |'EPA, les 
strates etaient composees d’unites geographiques contigués, 
c'est-a-dire que, dans une strate donnée, chaque unite devait 
toucher au moins une autre unite. Cette condition avait éte 
retenue en partie parce qu’on supposait que |’efficacité du 
plan de sondage serait assuree pendant plus longtemps avec 
de telles strates qu’avec des strates composées d'unités non 
contigués. 


To assess this assumption and adopt the best 
possible stratification, two means were considered for 
taking geography into account in the stratification. The 
first method consists of the use of geographic variables 
(centroids) as variables of interest. This method uses 
two centroids, which are transformations of longitude 
and latitude. It yields compact strata, that is, strata in 
which the distance between units is made minimal by 
minimizing the usual within-group sum of squares of 
the centroids. However, the minimization is tempered 
by minimization of the other variables of interest. 
Moreover, there is no assurance that these strata will 
be composed of contiguous units. 


A second approach was developed making use of 
contiguity vectors, which for each unit contained an 
identification of all units contiguous to it. This approach 
guaranteed contiguous, but not necessarily compact, 
strata. Under this approach optimization is performed 
as described above, but beginning, in this case, with a 
random starting partition that is contiguous. The gene- 
ration of such initial partitions is done automatically by 
the stratification system. The movement of units 
between strata is permitted only if, in addition to 
reducing the objective function, the contiguity of both 
strata is preserved. 


It was decided to standardize the stratification 
variables by introducing weighting factors inversely 
proportional to the total sum of squares of each 
variable. This standardization makes it possible to 
obtain a comparable contribution by each variable to 
the stratification. Flexibility was retained after stan- 
dardization to assign one or more variables of greater 
importance in relation to the other variables in the 
optimization by specifying a weight greater than one. 
For example, a variable weight of two would assign 
double importance. This feature was used to assign 
sufficient importance to centroids, without unduly 
affecting the optimization for non-geographic variables. 
With experimentation it was found that generally the 
combined use of contiguity vectors and centroids with 
a weight of 3 relative to other variables offered a good 
compromise. To assist in manually reviewing and 
assessing the geographic suitability of stratification, the 
system featured a plotting of centroids of the 
stratification units comprising each stratum. 


The stratification algorithm that was adopted did 
not place any limit on the number of stratification 
variables. Stratification variables were chosen based on 
results from a study of 11 Economic Regions across 
Canada, in which strata were delineated using 1971 
Census data, and assessed using 1981 Census data. It 
was found that a general stratification using 16 census 
variables resulted in the best stratification for estima- 
tion of labour force characteristics and for other 
characteristics as well. The 16 variables included the 
following: income; secondary education; eight variables 
related to employment (total persons employed, and 
persons employed by seven major industry groupings 
of agriculture, forestry and fisheries, mines, manufac- 
turing, constructions, transportation and services); four 
variables related to housing (number of owned 
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Pour vérifier cette hypothese et pouvoir adopter la 
meilleure stratification possible, on a envisage deux facons de 
tenir compte du critére géographique au moment de la 
stratification. La premiére méthode consiste a prendre les 
centroides comme variables-clés. Il s'agit donc d'utiliser deux 
variables géographiques (les centroides), qui sont une variante 
de la longitude et de la latitude. Cette méthode donne des 
strates compactes, c’est-a-dire des strates a |’interieur des- 
quelles la distance entre les unites est reduite au maximum en 
minimisant la somme des carrés intraclasse des centroides. 
Cette minimisation est cependant temperee par celle des 
autres variables-clés, et il n'y a aucune garantie que les 
strates ainsi obtenues seront composées d’unites contigues. 


La seconde méthode élaborée repose sur |’utilisation de 
vecteurs de contiguité, le vecteur relatif a chaque unite iden- 
tifiant toutes les unités qui y sont contigués. Cette methode 
garantit des strates contigués, mais pas necessairement com- 
pactes. On obtient l’optimisation de la facon deécrite plus haut, 
mais en commencant cette fois-ci par une partition initiale 
aléatoire d’unités contigués. Le systeme de stratification ge- 
nere automatiquement de telles partitions initiales. Le mouve- 
ment des unités entre les strates est permis uniquement si, en 
plus de réduire la fonction objective, il permet de preserver la 
contiguité des deux strates en cause. 


ll a eté décidé de normaliser les variables de stratification 
en introduisant des facteurs de ponderation inversement 
proportionnels a la somme totale des carrés de chaque 
variable. De cette maniere, chaque variable jouait un role 
comparable dans la stratification. Il etait toujours possible, 
apres la normalisation, de donner a une ou plusieurs variables 
davantage d’importance par rapport aux autres en leur 
attribuant un poids supérieur a 1 a |’étape de |’optimisation. 
Ainsi, on doublerait l’importance d’une variable en lui donnant 
un poids egal a 2. On s'est servi de ce moyen pour donner 
suffisamment d’importance aux variables geographiques (les 
centroides) sans pour autant trop nuire a l’optimisation pour 
les variables non géographiques. On a trouvé apres un 
certain nombre d’essais que |I'utilisation conjuguee des 
vecteurs de contiguite et des centroides auxquels on avait 
attribueé un poids de 3 par rapport aux autres variables 
constituait en général un bon compromis. Le systeme com- 
portait une fonction de representation graphique des 
centroides des unites de stratification comprises dans chaque 
strate, ce qui permettait de revoir la stratification et de 
déterminer si elle convenait du point de vue géographique. 


L’algorithme de stratification adopté n’imposait aucune 
limite quant au nombre de variables de stratification. Celles-ci 
ont ete choisies d’apres les résultats d’une étude portant sur 
11 régions Economiques prises dans l'ensemble du Canada et 
dont les strates avaient été délimitées en fonction des 
donnees du recensement de 1971 et vérifiges au moyen des 
donnees du recensement de 1981. On a trouvé que la 
meilleure stratification pour l’estimation des caractéristiques 
de la population active et d'autres caractéristiques également 
etait une stratification générale faisant entrer en jeu 16 
variables de recensement. Ces variables étaient : le revenu: 
les etudes secondaires; 8 variables ayant trait a l'emploi (nom- 
bre total de personnes occupées et nombre de personnes 
occupées selon sept grands groupes d’activités economiques 
soit l’agriculture, l’exploitation forestiere et la péche, les 
mines, le secteur manufacturier, le batiment, le transport et les 


dwellings, total gross rent, number of one person 
households, and number of two person households); 
and two geographic variables (centroids). 


2.3 Stratification in Self Representing Areas 


Individual urban areas designated as Self Re- 
presenting are known as Self Representing Units 
(SRUs). As the name implies, the SRU is the primary 
level of stratification of the SR sample. The extent of 
further stratification is largely dependent on the size of 
individual SRUs. 


Within the larger SRUs, the first level of strati- 
fication is due to the establishment of two separate 
sampling frames: a list frame of high rise apartment 
buildings, and an area frame covering remaining 
dwelling units. The smaller SRUs feature only an area 
frame. The further stratification within the area frame 
and apartment frame are described separately below. 


(a) Stratification of the Area Frame 


In the Census Metropolitan Areas (CMA), Census 
Tracts were adopted as stratification units. These 
are geostatistical units with populations between 
3,000 and 5,000 persons, which are stable from 
one census to the next. Both their size and their 
stability make them practical units for stratification. 
Primary and secondary strata were formed using 
the automated stratification system described in 
the previous section. 


The strata were made contiguous and compact by 
using contiguity vectors and weights of three on 
the geographic variables relative to other variables. 
Primary strata were made large enough to yield a 
sample take that was suitable for two interviewers. 
Secondary strata (4 to 5 per primary), were formed 
without regard to geographic constraints. 


The two levels of stratification in the larger SRUs 
had appeal on both operational and_ technical 
grounds. The relaxing of geographic constraints 
over those existing in the old design permitted 
greater optimality, while the retention of contiguity 
at a higher level provided a suitable unit for 
sample updating later in the decade, and facilitated 
the planning of interviewer assignments. Also, in 
the old design, SR strata were usually covered 
entirely by a single interviewer, and hence the 
variance estimates did not reflect the correlated 
response variance component of total variance. To 
the extent that within strata interviewer assign- 
ments are geographic and secondary strata are 
non-geographic, an interpenetration of strata and 
interviewer assignments has been achieved In the 
new design without incurring any additional data 
collection costs, resulting in this component being 
better reflected in the variance estimates. 
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services); 4 variables ayant trait au logement (nombre de 
logements possédés, loyer brut total, nombre de ménages a 
une personne et nombre de ménages a deux personnes); et 2 
variables geographiques (les centroides). 


2.3 Stratification dans les secteurs 
autoreprésentatifs 


On appelle unites autoreprésentatives (UAR) les régions 
urbaines classées dans la catégorie des secteurs autorepre- 
sentatifs. Comme leur nom l’indique, les UAR constituent le 
niveau primaire de stratification de |’échantillon autorepré- 
sentatif. Le nombre de niveaux de stratification de plus 
auxquels en procede dépend de la taille de |'UAR. 


Dans les grandes UAR, le premier niveau de stratification 
se justifie par la necessite d’etablir deux bases de sondage 
distinctes : une liste d’immeubles d'appartements et une base 
areolaire comprenant les logements restants. Dans les petites 
UAR, il n’y a qu'une base aréolaire. La stratification des bases 
areolaires et des bases d’'immeubles d'appartements est 
decrite ci-apres. 


a) Stratification de la base aréolaire 


Dans les régions metropolitaines de recensement, on a 
pris comme unites de stratification les secteurs de recen- 
sement. Il s’agit d’unites geostatistiques dont la popu- 
lation varie entre 3,000 et 5,000 habitants et qui ne 
changent pas d’un recensement a l'autre. Leur taille et 
leur stabilite en font des unites pratiques du point de vue 
de la stratification. Les strates primaires et secondaires 
ont ete formees au moyen du systeme de stratification 
automatise deécrit dans la section precedente. 


On a cree des strates contigués et compactes en utilisant 
les vecteurs de contiguite et en donnant aux variables 
geographiques un poids de 3 par rapport aux autres 
variables. On a forme des strates primaires assez grandes 
pour que le rendement de |’echantillon corresponde a la 
tache de deux intervieweurs. Les strates secondaires (4-5 
par strate primaire) ont ete constituees sans contraintes 
geographiques. 


Le fait de procéder a deux niveaux de stratification dans 
les grandes UAR présentait des avantages tant sur le plan 
opérationnel que sur le plan technique. Le relachement 
des contraintes geographiques qui existaient dans l’an- 
cien plan de sondage a permis de pousser plus loin 
l'optimalisation tandis que le fait de garder le critere de la 
contiguiteé au premier niveau de stratification produira des 
unites qui se préteront bien a la mise a jour de |’échan- 
tillon plus tard dans la déecennie et facilitera la planification 
de la tache des intervieweurs. En outre, dans |’ancien plan 
de sondage, il était probable qu'une strate AR serait 
entierement confiée a un seul intervieweur, de sorte qu'il 
n'était pas possible de cerner la part de la variance totale 
qui etait attribuable a la variance de réponse. Dans la 
mesure ou, dans chaque strate, la tache des intervieweurs 
est determinee en fonction de criteres geographiques et 
les strates secondaires sont formeées selon des criteres 
qui ne sont pas geographiques, on obtient dans le 
nouveau plan de sondage un recoupement des strates et 
des taches des intervieweurs qui n’entraine pas une 
augmentation du cout de la collecte des données et 
permet de mettre en evidence la part de la variance totale 
qui est attribuable a la variance de réponse. 


A limiting factor in the stratification algorithm was 
that the number of stratification units should not 
exceed 300, after which convergence of the 
algorithm slowed substantially. To deal with this, 
the largest SRUs were subdivided into major parts 
based on natural criteria as suggested by the 
geography, prior to the optimal stratification. 
Cities subdivided in this fashion were Montreal (7 
parts), Toronto (5), Winnipeg (2), Calgary (2), 
Edmonton (2), and Vancouver (3). 


In non-CMA but Census-Tracted SRUs, a single 
level non-geographic stratification was carried out 
using the stratification algorithm. In the non- 
tracted SRUs, formation of one to _ three 
geographic strata was done manually without any 
attempt at optimality. 


Table 1 presents study results for two SRUs — 
Ottawa and Quebec City — and compares efficien- 
cies of the geographic strata used in the old 
design with those of optimal two-level strata. This 
is done using 1971 Census data. Percent reduc- 
tions in the first stage variance due to stratification, 
calculated at the time of the 1981 Census, indicate 
the largest improvements are under the optimal 
stratification for income and rented dwellings. The 
marginal gains for other characteristics, including 
employed and unemployed, point to the strength 
and robustness of the simple, but deep, geogra- 
phic stratification in the old design. 


Table 1 


Percentage Reduction in First Stage Variance Due 


to Stratification 
Old vs. New Methods 
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Un facteur limitatif de l’algorithme de stratification était 
que le nombre d'unités de stratification ne devait pas 
dépasser 300, car au dela de ce point la vitesse de 
convergence de I'algorithme diminuait de fagon consi- 
dérable. On a donc, avant la_ stratification optimale, 
subdivisé les plus grandes UAR en principales parties en 
fonction de divisions géographiques naturelles. Les villes 
ainsi divisées étaient Montréal (7 parties), Toronto (5), 
Winnipeg (2), Calgary (2), Edmonton (2) et Vancouver (3). 


Dans les UAR qui étaient divisées en secteurs de recen- 
sement mais qui n’étaient pas des régions metropolitaines 
de recensement, on a procédé a un seul niveau de 
stratification selon des criteres non geographiques au 
moyen de I’algorithme de stratification. Dans les UAR qui 
n’étaient pas divisées en secteurs de recensement, on a 
formé une a trois strates géographiques a la main, sans 
souci d’optimalite. 


Le tableau 1 présente les résultats relatifs a deux UAR, 
Ottawa et la ville de Québec, d’une etude comparant, au 
moyen des données du recensement de 1971, l’efficacite 
de la stratification géographique utilisee dans l’ancien 
plan de sondage a celle de la stratification optimale a 
deux niveaux employée dans le nouveau plan. Les reduc- 
tions en pourcentage de la variance au premier degre 
attribuable a la stratification, calculees au moment du 
recensement de 1981, montrent que les plus grandes 
améliorations apportées par la stratification optimale con- 
cernaient le revenu et les logements loués. Le fait que les 
gains n’aient eté que marginaux pour ce qui est des 
autres caracteristiques, dont le nombre de personnes 
occupées et le nombre de personnes en chomage, donne 
une idée de la force et de la robustesse de la stratification 
géographique, simple mais détaillée, de l’ancien plan de 
sondage. 


Tableau 1 


Réduction en pourcentage de la variance au premier 
degré attribuable a la stratification 

Comparaison entre l’ancienne et la nouvelle méthode de 
stratification 


Stratification Method Stratification Method 
pee hints Methode de stratification ae Methode de stratification 
Old New Old New 
Ancienne Nouvelle Ancienne Nouvelle 
Total employed — Nombre de personnes occupees 941 12.6 Agriculture! 5.9 219 
Employment income — Revenu d'emploi 18.1 30.4 Forestry/fishing' — Exploi- 
Secondary education — Etudes secondaires 39.4 42.1 tation forestiére/peche! Cul 2.4 
Population 15+ - ans et plus 92 12.6 Mining! - Mines! 4.8 3.0 
Population 15-24 - ans 12.9 17.6 Manufacturing - Secteur 
Population 55+ —- ans et plus as | 29.7 manufacturier 23.5 pxeh | 
Total dwellings - Nombre total de logements 28.5 Som Construction -— Batiment 11.9 14.2 
Dwellings rented — Nombre de logements loues 20.9 28.8 Transport 42 6.4 
1 person households — Menages d'une personne Bout 38.4 Services 14.5 19.8 
2 person households — Menages de deux personnes 20.5 29.6 Unemployed! ~ Chdmeurs! (eu 97 


! Characteristics not used in optimization for new method. - Variables n'ayant pas servi a Voptimisation dans la nouvelle méthode 


(b) Stratification of the Apartment Frame 


To belong to the apartment frame, an apartment 
building must have at least 30 units and five floors 
of living quarters. The extent of stratification of the 
apartment frame varies from city to city, depend- 
ing principally on the number of apartment 
buildings. Montreal and Toronto each have four 
geographic strata, some of which are further sub- 
Stratified into size strata. In Toronto the geographic 
Strata are further divided into three size strata, 
corresponding to apartment buildings with less 
than 100 dwellings, apartment buildings with 
between 100 and 200 dwellings, and those with 
over 200 units. In Montreal only two size strata 
were formed, with 100 dwellings being the boun- 
dary point between strata. The SRU of Hamilton 
has both geographic strata, (for the cities of 
Hamilton and Burlington respectively) and two size 
Strata. Five other medium sized SRUs - Ottawa, 
Winnipeg, Calgary, Edmonton and Vancouver - 
have two size strata. 


The remaining SRUs which had an apartment 
frame were Halifax, Quebec City, Hull, Oshawa, 
Windsor, London, Kitchener, St. Catharines, 
Saskatoon, and Victoria. For these cities stratifica- 
tion of the apartment frame was not considered 
necessary due to the smaller number of apart- 
ments. 


In addition to the above stratification, a further 
implicit geographic stratification of apartment 
buildings on the frame at the time of the redesign 
was achieved by sorting the apartment frame units 
by the primary area frame stratum in which they 
were physically located. (Apartment building 
updates after the redesign are merely added to the 
bottom of the list for each stratum, and hence are 
not subject to this implicit stratification.) The 
numbering of apartment frame units incorporates 
the primary area stratum identification to facilitate 
placement of apartment frame selections with 
nearby area frame selections when forming 
assignments. 


2.4 Stratification and Delineation of Primary 
Sampling Units in Non Self Representing 
Areas 


2.4.1 General Considerations 


The following considerations were used in the 
choice of methods for stratification and delineation of 
Primary Sampling Units in NSR areas. 


(i) Number and size of PSU: The Primary Sampling 
Unit should be relatively compact geographically, 
with a sample yield of 55-60 dwellings, equivalent 
to an interviewer's assignment. There should be 
two to three selected per stratum. 
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b) Stratification de la base d’appartements 


Pour étre inscrit dans la base d’appartements, un 
immeuble doit compter au moins 30 unités et avoir cing 
étages de logements. Le nombre de strates formées dans 
la base d’appartements varie d'une ville a une autre, le 
principal critere étant le nombre d’immeubles d’apparte- 
ments. Quatre strates ont été créées a Montréal et a 
Toronto respectivement selon un critere géographique, 
dont certaines ont ensuite été subdivisées selon un critere 
de taille. A Toronto, les strates geographiques on ete 
divisées en 3 strates formées selon la taille : une strate 
pour les immeubles de moins de 100 logements, une 
strate pour les immeubles de 100 a 200 logements et une 
Strate pour les immeubles de plus de 200 logements. A 
Montreal, on n'a forme que 2 strates selon la taille, la 
ligne de demarcation etant 100 logements. L'UAR de 
Hamilton compte 2 strates geographiques (les villes de 
Hamilton et de Burlington) et en 2 strates formées selon 
la taille. On a fait 2 strates selon la taille aussi dans cing 
autres UAR de _ taille moyenne, Ottawa, Winnipeg, 
Calgary, Edmonton et Vancouver. 


Les autres UAR pour lesquelles on a constitué une base 
d'appartements étaient Halifax, la ville de Québec, Hull, 
Oshawa, Windsor, London, Kitchener, St. Catharines, 
Saskatoon et Victoria. Ces bases n'ont pas ete stratifices 
davantage vu le petit nombre d’appartements qu’elles 
contenaient. 


En plus de la stratification decrite ci-dessus, on a pro- 
cédé a une autre stratification geographique implicite des 
immeubles d’appartements qui faisaient partie de la base 
au moment du remaniement du plan de sondage en 
classant les unites de la base d’appartements selon la 
strate primaire de la base areolaire dans laquelle ils 
étaient situes. (Les nouveaux immeubles d’appartements 
sont simplement rajoutés au bas de la liste dressee pour 
chaque strate, et par consequent ne font pas l'objet de la 
stratification implicite). On inclut dans le numero attribue 
aux unites de la base d’appartements les chiffres iden- 
tifiant la strate primaire de la base areéolaire pour pouvoir 
grouper plus facilement dans la tache d’un intervieweur 
les unités choisies dans la base d’appartements et les 
unites voisines choisies dans la base areolaire. 


2.4 Stratification et delimitation des UPE dans les 
secteurs non autorepréesentatifs 


2.4.1 Criteres genéraux 


On s'est basé sur les criteres suivants pour choisir les 
méthodes de stratification et de delimitation a appliquer aux 
unités primaires d’échantillonnage dans les secteurs NAR. 


(i) Nombre d’UPE et taille : Une unite primaire d’echan- 
tillonnage (UPE) devrait etre relativement compacte du 
point de vue geographique et avoir un rendement de 
|'echantillon de 55 a 60 logements, ce qui equivaut a la 
tache d'un intervieweur. On devrait prelever 2 ou 3 UPE 
par strate. 


(ii) 


(iil) 


Stratification should be geographic within 
Economic Regions: Robustness of stratification 
was a key consideration in the choice of 
stratification variables. It was also the principal 
motivation for deciding to have geographically 
contiguous and compact strata, since it was 
reasoned that areas near one another geogra- 
phically had a better chance of retaining this 
homogeneity than did non-contiguous areas. 
Another motivation for geographic strata was to 
ensure a better geographic spread of the sample. 
This would generally tend to improve the capability 
for producing small area estimates for user defined 
domains. 


Within PSU heterogeneity: In the old LFS 
design, strata were formed using Census 
Enumeration Areas (EA) as stratification units, and 
then PSUs (which were groups of EAs) were 
delineated within strata. This sequence permitted 
greater optimality to be introduced in delineating 
PSUs, since PSUs could be made as similar as 
possible to the known characteristics of the 
stratum, thereby reducing the between-PSU com- 
ponent of sampling variance. Conceptually, making 
PSUs as similar as possible to the stratum or to 
each other, is equivalent to increasing the within- 
PSU heterogeneity as much as possible. The 
delineation of heterogeneous PSUs within strata 
has been retained in the new design. 


Bearing in mind the above considerations, and on 
the basis of studies carried out during the research 
phase of the redesign, the adopted design features 
explicit urban and rural stratification in Economic 
Regions where the population of area type is 
sufficient to permit separate strata. Roughly 50% 
of the Economic Regions (34 out of 71) qualify for 
this type of urban-rural design. In 31 of the 
remaining ER, a mixed design exists where 
primary strata within Economic Regions consist of 
both rural and urban areas. The mixed design is 
similar to the old design in the NSR areas. 


Then there are some special cases. Economic 
Region 590 in Northern Ontario is unique, and is 
divided into two strata using the proportion of the 
labour force engaged in mining as the stratification 
variable. The remaining five economic regions do 
not contain any NSR areas. Four of them are in 
northerly parts of Quebec, Manitoba, Saskat- 
chewan and British Columbia (which apart from 
some SRUs were designated remote), and the 
other is entirely Self Representing (Economic 
Region 67- the city of Winnipeg). 
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(ii) 


(iii) 


Stratification géographique dans les RE : Un des plus 
importants buts, que le choix des variables de strati- 
fication devait permettre d’atteindre, était la robustesse de 
la stratification. C’était principalement a cette fin aussi 
qu'il a été décidé que les strates seraient contigues et 
compactes au plan géographique, en vertu du raisonne- 
ment selon lequel les régions voisines l'une de |’autre ont 
de meilleures chances de demeurer homogenes que les 
régions non contigués. Le critere geographique a aussi 
été retenu parce qu’il assurerait une meilleure dispersion 
de |’échantillon, ce qui en général permet d'etre davan- 
tage en mesure de produire des estimations regionales 
pour des domaines définis par les utilisateurs. 


Hétérogéneéité a l’intérieur des UPE: Dans l’ancien 
plan de sondage de |'EPA, on formait les strates en 
prenant d’abord les secteurs de dénombrement (SD) du 
recensement comme unites de_ stratification puis en 
délimitant les UPE (qui étaient des groupes de SD) a 
V'intérieur des strates. Cet ordre permettait de delimiter 
les UPE de facon plus optimale, car on pouvait faire en 
sorte que les caractéristiques de la population des UPE 
se rapprochent le plus possible des caractéristiques 
connues de la population de la strate et ainsi réeduire la 
partie de la variance d’échantillonnage attribuable aux 
UPE. Théoriquement, si l'on s’arrange pour qu'il y ait le 
plus de similitude possible entre les UPE et la strate ou 
entre les UPE les unes par rapport aux autres, cela 
revient a augmenter I’hétérogenéite des UPE le plus pos- 
sible. La délimitation d’UPE héterogenes a |’interieur des 
strates est un critere qui a ete retenu dans le nouveau 
plan de sondage. 


En tenant compte des criteres enoncés ci-dessus et en se 
fondant sur les résultats d’études effectueées pendant la 
période de recherche qui a préecedé le remaniement du 
plan de sondage, on a adopte un plan selon lequel les RE 
étaient explicitement stratifiees en régions rurales et en 
regions urbaines partout ot la population était suffisante 
pour permettre de former des strates distinctes. Environ 
50% des regions economiques (34 sur 71) ont pu se 
préter a ce plan urbain-rural. Dans 31 des RE restantes, 
on a appliqué un plan mixte selon lequel les strates 
primaires dans les RE sont composées a la fois de 
regions rurales et de régions urbaines. Ce plan mixte 
ressemble a |l’ancien plan pour les secteurs NAR. 


ll y a ensuite quelques cas spéciaux. La RE 590 dans le 
nord de l'Ontario est unique en son genre, en ce sens 
qu'elle est divisée en 2 strates selon une variable de 
Stratification qui est la proportion de la population active 
travaillant dans les mines. Les 5 RE restantes ne con- 
tiennent pas de secteurs NAR. Quatre d’entre elles sont 
situees dans le nord d’une province, en l’occurrence le 
Québec, le Manitoba, la Saskatchewan et la Colombie- 
Britannique, et, exception faite de quelques UAR, ont été 
classees dans la catégorie des régions éloignées, tandis 
que la derniére est entiérement autoreprésentative (RE 
67, la ville de Winnipeg). 


2.4.2 Urban-Rural Design 


Within the urban portion of the Economic Region, 
individual urban centres are generally taken as PSUs 
although occasionally small urban centres are 
combined. In most Economic Regions there is only 
sufficient urban population to permit one urban 
stratum, whereas in a few cases the urban portion of 
the Economic Region is further stratified geogra- 
phically. 


Where the population of the rural portion of the 
Economic Region permits it (about 40% of cases), 
there is optimal sub-stratification. The 1981 Census 
enumeration area was used as the stratification unit in 
all provinces except Quebec and Ontario. The 
Economic Regions are larger in these provinces, with 
typically over 300 rural EAs per Economic Region, and 
due to the slow convergence of the stratification 
algorithm with this many units, rural Census Sub- 
divisions were taken as stratification units. The strata 
are geographically contiguous and compact strata, and 
are based on the 16 Census characteristics described 
earlier. (The number of urban and rural strata per 
Economic Region is given in Appendix E.) 


The delineation of PSUs within rural strata is 
conceptually very similar to stratification. The only 
difference is that in stratification we attempt to 
minimize the sums of squares of the geographic and 
non-geographic variables within each stratum, while in 
PSU formation, we want to minimize the sums. of 
squares of the geographic variables (to obtain compact 
PSUs in order to reduce costs) and to maximize those 
of the non-geographic variables. The latter criterion 
results in PSUs that are as heterogeneous as possible 
in terms of characteristics, so that they are all properly 
representative of the stratum during sampling. 


There is, however, a conflict between the desired 
compactness of the PSUs and their heterogeneity, due 
to the tendency of adjacent units to possess similar 
characteristics. The low marginal computing costs 
permitted three delineations per stratum, with centroid 
weights of 10, 15 and 20 relative to the other variables. 
The results of each delineation were then plotted by 
computer on a graph whose axes are the centroids. 
The best of the three delineations was chosen based 
on the quality of the stratification as measured by 
stratification indices, and by visual inspection of the 
graphs for compactness. A compactness index was 
also taken into consideration. In most cases, a centroid 
weight of 10 or 15 was chosen. 
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2.4.2 Plan urbain-rural 


Dans la partie urbaine d’une region économique, on prend 
generalement chaque centre urbain pour en faire une unite 
primaire d’échantillonnage, quoiqu’il arrive a l'occasion qu’on 
rattache les petites régions urbaines aux centres urbains 
voisins. Dans la plupart des RE, la population urbaine ne 
permet de former qu’une strate urbaine, sauf dans un petit 
nombre de cas ou la partie urbaine d’une RE est stratifiee une 
fois de plus selon des criteres geographiques. 


Lorsque la population de la partie rurale d’une region 
economique le permet, (environ 40% des cas) la sous- 
Stratification est optimale. On a pris les secteurs de 
dénombrement (SD) du recensement de 1981 comme unites 
de stratification dans toutes les provinces sauf au Québec et 
en Ontario. Dans ces provinces, les RE sont plus grandes, 
chacune comptant genéralement plus de 300 SD ruraux; etant 
donne que la vitesse de convergence de l'algorithme de 
Stratification est moins grande lorsqu’il y a tant d’unites, on a 
pris comme unites de _ stratifications les subdivisions de 
recensement rurales. Les strates sont contigués et compactes 
et sont formées en fonction des 16 caracteristiques de 
recensement décrites plus haut. Le nombre de strates rurales 
et urbaines par region Economique est donne en annexe. 


Du point de vue théorique, la delimitation des UPE dans 
les strates rurales ressemble a de la stratification. La seule 
difference est que, lorsqu’on fait de la stratification, on essaie 
de minimiser la somme des. carres des_ variables 
geographiques et non geéographiques dans chaque strate, 
tandis que lorsqu’on forme des UPE, on veut minimiser la 
somme des carrés des variables geéographiques (pour obtenir 
des UPE compactes et ainsi reduire les couts) et maximiser 
celle des variables non géographiques. On obtient ainsi des 
UPE qui sont aussi héterogenes que possible du point de vue 
des caracteristiques de la population et donc _ bien 
representatives de la strate lorsqu’elles sont echantillonnees. 


Les deux buts poursuivis (la compacite et I‘heterogeneite 
des UPE) sont cependant en contradiction, car les unites 
adjacentes possedent generalement des  caracteristiques 
semblables. Comme les frais marginaux de calcul étaient 
faibles, on a pu faire 3 délimitations par strate en attribuant 
aux centroides des poids de 10, 15 et 20 par rapport aux 
autres variables. On a ensuite represente par ordinateur 
chaque delimitation ainsi obtenue sur un graphique dont les 
axes étaient les centroides, puis on a choisi la meilleure des 
trois délimitations en fonction de la qualite de la stratification 
telle que mesurée par les indices de stratification et de la 
compacité des unites telle que reveleée par |l’examen visuel 
des graphiques. On a egalement utilise un indice de 
compacité. Dans la plupart des cas, on a retenu un poids de 
10 ou de 15 pour les centroides. 


2.4.3 Mixed Design 


The mixed design exists in the roughly 50 percent 
of Economic Regions where there ts insufficient urban 
or rural population to form separate strata. For two- 
thirds of these ERs, the combined urban and rural 
population is insufficient to permit sub-stratification. 
For the ERs with sufficient population for more than 
one mixed stratum, rural EAs and urban centres were 
used as stratification units, and geographically con- 
tiguous strata were formed using the 16 Census 
variables. 


For PSUs in the mixed strata, an additional 
constraint is that the proportion of urban population 
must be approximately the same in each PSU. This 
constraint, which existed in the old LFS design, was 
retained on the grounds that urban and_ rural 
distinctions are important, particularly for estimation of 
such characteristics as persons employed in agricul- 
ture. 


The constraint on the urban/rural ratio results in an 
implicit urban/rural stratification in the mixed design. It 
was achieved as follows. Each urban centre was 
divided into a number of parts such that the total 
number of urban parts within a stratum was equal (or 
double in some cases) to the number of PSUs in that 
stratum. The number of parts per urban centre was 
determined in proportion to the population of the 
centre. 


The optimal stratification program was applied, 
considering each part of an urban centre as a distinct 
Stratification unit, and by considering urban population 
as an extra Stratification variable. The weight assigned 
to this variable was adjusted to obtain the most evenly 
balanced rural/urban distribution possible within each 
PSU, without unduly disrupting compactness and 
overall optimization. This was done by trial and error. 
In practice, a weight of 10 or 15 on urban population, 
relative to the other variables, produced satisfactory 
results. Notwithstanding these attempts, in some strata 
one or two PSUs received no urban component, largely 
due to the lack of urban centres in the vicinity. 
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2.4.3 Plan mixte 


On a appliqué un plan mixte dans les quelque 50% des 
RE ou la population urbaine ou rurale n’était pas suffisante 
pour qu’on puisse former des strates distinctes. Dans les deux 
tiers de ces RE, la population urbaine et rurale combinée ne 
pouvait pas étre sous-stratifiée pour la meme raison. Dans les 
RE ou la population était assez élevée pour qu'on puisse créer 
plus d'une strate mixte, on a pris les SD ruraux et les centres 
urbains comme unités de stratification et on a forme des 
strates géographiques contigués en se servant des 16 varia- 
bles de recensement. 


ll y avait une contrainte de plus pour les UPE des strates 
mixtes, a savoir que la proportion de Ja population urbaine 
devait étre a peu pres la méme dans chacune d’entre elles. 
Cette contrainte, qui existait déja dans l’ancien plan de 
sondage, a ete maintenue parce que la distinction région 
urbaine-région rurale est importante, particulierement si l'on 
veut estimer certaines caractéristiques comme le nombre de 
personnes ayant un emploi dans le domaine de |’agriculture. 


Le ratio a respecter pour ce qui est de la population 
urbaine et de la population rurale a entraine une stratification 
implicite des régions urbaines et rurales, qui a ete realisee de 
la facon suivante. Chaque centre urbain a ete divisé en un 
certain nombre de parties de maniere que le nombre total de 
parties urbaines dans une strate soit égal au nombre d’UPE 
dans cette strate (ou egal a deux fois ce nombre, dans 
certains cas). Le nombre de parties par centre urbain etait 
proportionnel a la population du centre. 


On a execute le programme de stratification optimale en 
considérant chaque partie d’un centre urbain comme une 
unite de stratification distincte et la population urbaine, comme 
une variable de stratification supplementaire. Le poids attri- 
bue a cette variable a ete rajusté de maniere a obtenir la 
distribution rurale/urbaine la plus equilibree possible dans 
chaque UPE sans trop nuire a la compacite et a l’optimisation 
globale. Ce but a ete atteint par tatonnements. On a obtenu 
des resultats satisfaisants en attribuant un poids de 10 ou de 
15 a la population urbaine par rapport aux autres variables. 
Malgre cela, dans certaines strates, une ou deux UPE n'ont 
pas eu de partie urbaine, principalement parce qu'il n'y avait 
pas de centre urbain a proximite. 


Chapter 3 


Self Representing Areas 


3.1. Introduction 


As noted earlier, the Self Representing Units 
correspond to those urban centres which are 
sufficiently large to yield an expected sample of 50 
dwellings. Stratification of the Self Representing areas 
was discussed in the previous chapter. Formation and 
selection of units, together with the mechanism for 
updating the sample, are described in this chapter. 


3.2 Formation of Self Representing Units 


The SR universe was created in two steps: (i) the 
identification of cities, towns or Census Agglomerations 
(CAs) large enough to qualify as SRUs, and (ii) the 
delineation of boundaries. The criterion for designating 
a city, town or CA as SRU was that it should yield a 
sample of 50 or more dwellings. This cut-off was taken 
based on the judgement by survey operations staff of 
what should constitute a minimum assignment size, 
supported by analyses showing generally higher per 
unit data collection costs for smaller assignments. 


For the Census Metropolitan Areas (CMAs), 1981 
Census boundaries were automatically adopted as 
SRU boundaries, due to the requirement to publish 
CMA estimates. For remaining SRUs, decisions were 
made by examining maps case by case with a 
preference being given to respecting the 1981 Census 
boundaries; the exception was where they included 
large tracts of rural areas that would have increased 
travel distances and rendered the two-stage sample 
design expensive. Such departures occurred most 
frequently with CAs, since their boundaries are defined 
in terms of complete Census Subdivisions (CSDs). In 
such cases, SRU boundaries were defined either by 
dropping some CSDs altogether, or by splitting the 
CSD and including only those Enumeration Areas 
(EAs) that were reasonably built-up and close to the 
urban core. 


3.3 Sample Design for Area Frame 


3.3.1 Choice of Clusters 


The main thrust in defining clusters, the first stage 
units, was to make use of 1981 Census units and 
dwelling counts wherever possible. This avoided the 
cost of an independent field count, which was_ used in 
the last redesign. The choice of unit depended on both 
theoretical and operational considerations. 


Chapitre 3 


Secteurs autoreprésentatifs 


3.1. Introduction 


Comme nous |'avons vu, les unités autoreprésentatives 
(UAR) correspondent aux centres urbains  suffisamment 
grands pour avoir un rendement preévu de |’échantillon de 50 
logements. La stratification des secteurs AR a deja ete décrite 
dans le chapitre precedent. Dans celui-ci, il sera question de 
la formation et de la sélection des unités ainsi que du 
mecanisme de mise a jour de |'échantillon. 


3.2 Formation des unites autorepresentatives 


L’univers des unités autoreprésentatives a ete cree en 
deux etapes : la premiere a consisté a déterminer quelles 
villes ou agglomerations de recensement étaient suffisamment 
grandes pour étre des UAR; la seconde a consisté a délimiter 
les unites. Le critere pour qu'une ville ou agglomeration de 
recensement soit considérée comme une UAR etait qu'elle ait 
un rendement de |’échantillon d’au moins 50 logements. Ce 
seuil a été établi en fonction de ce qui, de |’avis du personnel 
des operations de |’enquéte, devrait etre la tache minimum 
d'un intervieweur, opinion etayée par les résultats d’analyses 
qui ont montre que le cout par unite de la collecte des 
donnees etait generalement plus éleve lorsque la tache etait 
inférieure a ce seuil. 


Pour les régions métropolitaines de recensement, les 
limites du recensement de 1981 sont automatiquement deve- 
nues celles des UAR du fait qu'on est tenu de publier des 
estimations s'y rapportant. Pour les autres UAR, la decision a 
ete prise Cas par cas apres examen des cartes. On a donne 
la preference aux limites du recensement de 1981. sauf 
lorsqu’elles englobaient de trop vastes etendues rurales, car 
les distances a parcourir auraient ete trop grandes et le cout 
du plan d’echantillonnage a deux degrés aurait ete trop eleve. 
C’est surtout pour les agglomérations de recensement qu'il a 
fallu faire ce genre d’exception, car leurs limites reprennent 
celles de subdivisions du recensement (SDR) completes. 
Dans ces cas-la, pour délimiter les UAR, on a laissé tomber 
certaines SDR entieres tandis que, de certaines autres, on a 
conserve seulement les SD qui étaient suffisamment batis et 
gui se trouvaient pres du centre urbain. 


3.3 Plan de sondage pour la base areolaire 
3.3.1 Choix des grappes 


Le principe directeur pour la definition des grappes, c’est- 
a-dire les unites du premier degre, a ete d'utiliser autant que 
possible les unités et les chiffres sur les logements du 
recensement de 1981 afin d’eviter d’avoir a supporter le cout 
du dénombrement indépendant sur le terrain qu'il avait fallu 
assumer avec l’ancien plan de sondage. Le choix des unites 
a ete determine en fonction de criteres d’ordre théorique et 
opeérationnel. 


A key operational consideration was clearly the 
level of geographic detail for which dwelling counts 
could be obtained from the 1981 Census. The lowest 
level for which automated retrieval of Census data 
could be done was the block face for areas falling 
under the coverage of the Area Master File (AMF). 
The AMF areas, accounting for 76% of the SR 
universe, corresponded to built-up portions of CMAs 
and the larger non-CMAs. The non-AMF portion of the 
SR universe was made up of the fringe portions of the 
CMAs and larger CAs, and smaller urban centres 
(comprising 13% and 11% of the SR _ universe, 
respectively). In non-AMF areas, the EA is the lowest 
unit for which Census counts can be retrieved by 
automation. 


An alternative to using counts at the EA level for 
the non-AMF areas was to manually access the EA 
maps and visitation records used by Census enumera- 
tors to break down the counts into smaller units such 
as blocks and block faces. Given the availability of 
data for block faces, blocks and EAs, all three were 
examined as alternative choices for clusters. The block 
face was ruled out as being too small a unit which 
would have required frequent combining (e.g., over 
20% had five or fewer dwellings). 


From a sampling-theoretic point of view, for the 
case of an up-to-date design, there was not much of a 
choice between the EA and block: empirical results 
showed that variances for a two-stage design differed 
very little for the EA versus the block as a first stage 
unit (Choudhry, Lee and Drew, 1985). Hence, the 
choice was guided more by operational considerations 
of redesign and of robustness of the sample in the 
event of growth. 


For the Area Master File areas, blocks were 
adopted as units since the availability of the counts in 
machine readable form from the Census database 
permitted a highly automated low cost redesign, the 
splitting or combining of blocks being required in less 
than 5% of cases. Moreover, the potential was re- 
cognized for linking blocks from one Census to the 
next due to their relative stability as geostatistical units. 
This permited low cost quinquennial updating of the 
sample. In the fringe (non-AMF) portions of the larger 
urban areas, EAs were generally taken as the sampling 
unit. This was done on the grounds that in these areas 
with potential for large growth, an EA based design, 
due to the larger size of the units, would be less 
susceptible to deterioration of the sampling efficiency. 


Finally for the non-AMF urban areas, the block was 
generally chosen as the sampling unit, and dwelling 
counts were obtained by manually accessing the visita- 
tion records. Although adoption of the EA would have 
required less initial work in designing the sample, over 
time this would have been offset by higher listing and 
list maintenance costs associated with EAs. Another 
important consideration for the choice of block over EA 
as the sampling unit in these SRUs was the design 
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Le niveau de détail géographique auquel il était possible 
d'obtenir des chiffres sur les logements dans la base de 
données du recensement de 1981 a certainement été un 
critére opérationnel important. Le plus faible niveau auquel on 
pouvait extraire automatiquement des donnees de recen- 
sement pour les régions représentées dans le fichier principal 
des régions (FPR) était le cote d'ilot. Les régions represen- 
tées dans le FPR (76% de l’univers AR) étaient les zones 
baties des RMR et les grandes villes autres que les RMR. La 
partie de l’univers AR non représentée dans le FPR etait 
composée des banlieues des RMR et des grandes agglomera- 
tions de recensement ainsi que des petits centres urbains 
(13% et 11% de l’univers AR respectivement). En ce qui 
concerne les régions non représentées dans le FPR, le SD est 
la plus petite unité pour laquelle il est possible d’extraire 
automatiquement des chiffres du recensement. 


ll existait une autre possibilité que celle de prendre les 
chiffres au niveau des SD pour les régions non représentees 
dans le FPR, et c’était de se servir des cartes des SD et des 
registres des visites utilisés par les recenseurs pour ventiler 
les chiffres selon de plus petites unités, notamment les ilots et 
les cdtés d’ilot. Comme on avait acces a des données sur les 
cétes dilot, les ilots et les SD, on a étudié les trois possibilites 
qu'ils représentaient pour la formation des grappes (unites de 
premier degré). Les cotes d'ilot ont ete elimines parce qu’ils 
auraient donne lieu a des unités trop petites qu'il aurait fallu 
grouper dans trop de cas (plus de 20% des cotes dilot ne 
comptaient pas plus de 5 logements). 


Du point de vue théorique, pour un échantillon a deux 
degrés a jour, le choix était difficile a faire entre les SD et les 
ilots comme unités du premier degre, car, selon les résultats 
empiriques, les variances différaient peu selon qu’on prenait 
les uns ou les autres (Choudhry, Drew et Lee 1985). On a 
donc fondé la décision sur des criteres d’ordre opeérationnel, 
a savoir lequel des plans de sondage serait plus facile a 
remanier et lequel des deux échantillons serait plus robuste 
face a la croissance de la population. 


Pour les régions représentées dans le FPR, on a pris les 
ilots comme unités, car le fait d’avoir accés aux chiffres sous 
forme ordinolingue dans la base de données du recensement 
permettrait de remanier le plan de l’échantillon presque 
entierement automatiquement et a peu de frais, moins de 5% 
des ilots ayant besoin d’étre scindés ou groupes. En outre, on 
pensait qu'il serait possible de faire le lien entre les ilots d’un 
recensement a l'autre en raison de leur stabilité relative en 
tant qu’unités géostatistiques, ce qui permettrait de faire une 
mise a jour quinquennale de |’échantillon a peu de frais aussi. 
Pour les banlieues des grandes villes (non représentées dans 
le FPR), on a généralement pris les SD comme _ unités 
d’échantillonnage la population de ces secteurs étant 
susceptible de s’accroitre beaucoup, la grande taille des 
unites empécherait probablement une baisse de |’efficacité du 
plan d’échantillonnage de se produire. 


Enfin, pour les régions urbaines non représentées dans le 
FPR, l'unite d’échantillonnage choisie a généralement été 
lilot, et on a obtenu les chiffres sur les logements en 
consultant les registres des visites. La conception de la base 
de sondage aurait demandé moins de travail au départ si on 
avait pris les SD, mais alors ce gain aurait été plus que 
compense par le cout eleve de |’établissement et de la mise 
a jour des listes. Il y a un autre critére important qui a joué un 
role dans le choix des ilots plutot que des SD comme_ unités 


constraint that six or a multiple of six clusters be 
selected per SRU (for equal representation of all 
rotation groups). Within the adoption of EAs as 
Clusters, the smaller sizes of these SRUs would have 
yielded unacceptably high first Stage sampling rates. 


3.3.2 Formation of Clusters 


(a) AMF Areas: Formation of clusters in the AMF 
areas was Carried out in five steps as described 
below: 


(i) Geographic File: Geography Division created an 
area file for retrieval of Census data at the block 
face level. The area file contained the following for 
each block face: the block face, block and FED-EA 
numbers; the Universal Transverse Mercator 
(UTM) co-ordinates; street name and address 
range; and “pointers” linking the geographic entity 
to Census data on the Census database. 


(ii) Retrieval of Census Data: Census Operations 
Division used the area file to retrieve the following 
Census data by block face: 


- counts of private occupied dwellings, broken 
down by high rise apartment dwellings versus 
all other dwelling types; and 

= counts of inmates and other residents of collec- 
tive dwellings. 


(iii) Treatment of Exclusions: All records belonging 
to an Indian reserve EA or to an EA belonging to 
the Special Area frame were dropped from the file. 


(iv) Unduplication of Area and Apartment Frames: 
Adjustments were required to the Census counts 
of apartment and non-apartment dwellings to 
account for conceptual difference between the LFS 
and Census definitions of apartment (buildings 
with five floors and less than 30 units are classified 
as apartments by the Census but not by the LFS). 
This involved plotting LFS apartment clusters on 
Census blocks. 


Formation and Mapping of Clusters: The 
desired range for number of (non-apartment) 
dwellings in a cluster was set at 20-100. The 
preliminary computer-generated clusters corre- 
sponded to blocks, if the dwelling counts were In 
this range. The larger blocks were split if two 
clusters satisfying the size constraints could result 
from treating the block faces as separate clusters. 
Also, high and low (or zero) count blocks requiring 
manual splitting or combining were separately 
listed. The block face composition of clusters 
formed by the splitting and combining was 
subsequently data-captured to produce a machine 
readable file giving the block face composition of 


all clusters. 


_— 
< 
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d’échantillonnage dans ces UAR, et c’est que le nombre de 
grappes formées dans chaque UAR devait étre de six ou un 
multiple de six (afin que tous les groupes de renouvellement 
soient egalement représentés). Si on avait pris les SD comme 
grappes dans ces petites UAR, les fractions de sondage au 
premier degré d’échantillonnage auraient été trop élevées. 


3.3.2 Formation des grappes 
a) Régions représentées dans le FPR: La formation des 


grappes dans les régions représentées dans le FPR a ete 
faite en cing étapes, décrites ci-apreés. 


— 
Noe 


Fichier géographique : La Division de la géographie a 
créé un fichier aréolaire pour l’extraction des données de 
recensement au niveau du cote dilot. Pour chaque céte 
dilot, il y avait dans le fichier aérolaire : le numéro du 
cété dilot, de lilot, de la CEF ainsi que du SD; les 
coordonnées de la projection transverse de Mercator 
(PTM); le nom de la rue et la fourchette d'adresses: des 
indicateurs permettant de faire le lien entre l’entite geo- 
graphique et les données dans la base du recensement. 


Extraction des données de recensement: La Division 

des operations du recensement s'est servie du fichier 

aréolaire pour extraire les données de recensement 
suivantes par cote d’ilot : 

— nombre de logements privés occupés, répartis selon 
deux catégories : les logements dans les grands 
immeubles d’appartements et les autres logements; 

— nombre de détenus et autres résidents de logements 
collectifs. 


(i 


~— 


(iii) Traitement des exclusions : Tous les enregistrements 
se rapportant a un SD qui correspondait a une réserve 
indienne ou qui faisait partie de la base des secteurs spe- 
ciaux ont ete retires du fichier. 


(iv) Non chevauchement de la base aréolaire et de la 
base d’appartements : || a fallu modifier les chiffres du 
recensement sur les appartements et les autres types de 
logements parce que la definition d'un appartement n'est 
pas la meme pour le recensement et pour I’'EPA (un 
immeuble a cing etages comptant moins de 30 unites est 
considéré comme un immeuble d’appartements aux fins 
du recensement mais pas de |’EPA). Pour cela, on a 
representé les grappes d’appartements graphiquement 
sur les ilots de recensement. 


Formation et representation des grappes sur les 
cartes : On a fixe a 20 et 100 le nombre minimum et 
maximum de logements (autres que les appartements) 
qu’on voulait avoir dans une grappe. Les grappes 
provisoires generees par ordinateur correspondaient a 
des ilots, a condition que le nombre de logements tombe 
dans cette fourchette. On a subdivise les grands ilots si, 
en traitant les cotes d’ilot comme des grappes différentes, 
on pouvait obtenir deux grappes répondant au critere de 
taille. En outre, on a mis sur une liste distincte les ilots 
dans lesquels le nombre de logements était trop éleve ou 
trop faible (voire nul), et qui donc devaient étre subdivises 
ou groupés manuellement. On a ensuite introduit dans 
l'‘ordinateur les données sur la composition par cote d’ilot 
des grappes obtenues par subdivision ou groupement 
diilots afin d’avoir un fichier informatique indiquant la 
composition de toutes les grappes par cote d’ilot. 


— 
< 
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Clusters were numbered serially within strata (also 
called subunits), and were manually plotted on 
1981 Census Tract maps. Generally there were 
three to five Census Tracts per stratum. 


Non-AMF Areas: For the 107 non-AMF Self 
Representing Units, cluster formation was carried 
out using 1981 Census Visitation Records (VRs) 
and accompanying Enumeration Area Maps. The 
Visitation Records are a basic working document 
of Census Representatives on which these per- 
sons list separately: (i) private occupied dwelling 
units, (ii) collective dwellings, and (ili) unoccupied 
dwelling units. Normally these lists contain civic 
addresses of the dwellings, but where no civic 
addresses exist, dwellings are often listed by the 
name of the occupant. Accompanying each visita- 
tion record is an Enumeration Area map, on which 
the Census Representatives plot the location of 
individual dwellings listed on the VR, and indicate 
by arrows the path followed in canvassing the EA. 


The first step in cluster formation consisted of 
using these documents to indicate dwelling counts 
by block and block face on urban place maps of 
the SRUs. Other salient features were also plotted 
on the place maps, such as EA boundaries, and 
natural physical features such as railway tracks 
that could be used to sub-divide large counts. 
Collective dwellings and apartments with 30 or 
more units were also plotted, with descriptions in 
the margins. For rural EAs on the fringes of the 
SRUs, less detailed counting based on physical 
features was carried out. When counting was not 
possible — for example, where the EA map was of 
poor quality — the EA was left intact If its dwelling 
count was acceptable for a cluster. Otherwise, 
these EAs were sent for field counting, which was 
done for only 3% of the EAs. 


After counts were transferred to the maps, clusters 
were delineated using criteria similar to those used 
in AMF areas; thus, clusters should be blocks, 
combinations of blocks, or block faces, with counts 
of 20-100 dwellings. Separately plotted apartment 
buildings were generally taken as clusters by 
themselves. As clusters were formed they were 
delineated on the maps, and the dwelling counts 
were entered on control sheets for data capture for 
computerized selection of clusters. 
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On a numéroté en série les grappes dans les strates 
(appelées aussi sous-unités) et on les a representées 
graphiquement sur les cartes des secteurs de recense- 
ment de 1981. Il y avait généralement de 3 a 5 secteurs 
de recensement par strate. 


Régions non représentées dans le FPR : Pour les 107 
UAR des régions non représentées dans le FPR, on a 
formé les grappes a l’aide des registres des visites du 
recensement de 1981 et des cartes des secteurs de 
dénombrement qui accompagnaient ces derniers. Les re- 
gistres des visites sont des documents de travail de base 
des recenseurs sur lesquels ceux-ci inscrivent separe- 
ment la liste (i) des unites de logements priveés occupes; 
(ii) des logements collectifs; (iii) des unites de logements 
inoccupés. Normalement, les logements sont identifies 
par leur adresse de voirie; s'il n'y a pas d’adresse de 
voirie, ils le sont souvent par le nom de |’occupant. 
Chaque registre des visites est accompagne d'une carte 
du secteur de dénombrement, sur laquelle le recenseur 
indique l'emplacement de chaque logement inscrit dans 
le registre des visites et, au moyen de fleches, |’itineraire 
qu'il suit lorsqu’il parcourt le secteur. 


La premiere etape de la formation des grappes a 
consisté a se servir de ces documents pour indiquer le 
nombre de logements par ilot et par cote diilot sur les 
cartes des régions urbaines des UAR. On a indique 
d'autres élements importants sur ces cartes, comme les 
limites des SD, ainsi que les particularites physiques 
telles les voies ferrees dont on pourrait se servir pour 
subdiviser les secteurs a population trop elevee. On a 
indiqué de facon distincte les logements collectifs et les 
immeubles d’appartements comptant 30 unites ou plus, et 
on a ajoute dans les marges des descriptions s'y rappor- 
tant. Pour ce qui est des SD ruraux a la limite des UAR, 
on a indique des données moins detaillees en fonction 
des divisions physiques plutot que des unites de 
logement. La ou il nétait pas possible d’indiquer de 
chiffres, notamment parce que la carte du SD était trés 
mauvaise, on a laisse le SD tel quel a condition que le 
nombre de logements permette de former une grappe. 
Autrement, on a demandé un dénombrement sur le terrain 
du SD, ce qui n’a été fait que pour 3% des SD. 


Apres avoir transferé les chiffres sur les cartes, on a 
délimité les grappes selon des criteres semblables a ceux 
utilises pour les regions représentées dans le FPR : les 
grappes devraient etre des ilots, des groupes d’ilots ou 
des cotés d'ilots et comporter entre 20 et 100 logements. 
Les immeubles d’appartements indiqués de facon dis- 
tincte ont genéralement constitueé des grappes a eux 
seuls. Au fur et a mesure que les grappes ont été 
formees, on les a délimitées sur les cartes et on a inscrit 
les nombres de logements sur les feuilles de contrdle 
pour la saisie des données en vue de la_ sélection 
automatique des grappes. 


3.3.3 Choice of the Selection Method 


clusters were selected using the method due to Rao 
Hartley and Cochran (1962). Considerations which led 


From each stratum, six (or in special cases 12) 


rT 


to the retention of this method are the same as those 
that led to its initial adoption at the time of the 1973 
redesign, and are as follows: 


(a) 


Simplicity in Updating: Since changes in the 
siZé measures are inherent in any continuous sur- 
vey based on area sampling methods, the 
adaptability of the selection method to a simple 
procedure of revision of the selection probabilities 
iS an important criterion for the choice of a 
selection method in the initial design. For many 
complex selection methods involving two or more 
selections, the revision of initial selection proba- 
bilities requires complex treatments due to their 
diverse joint inclusion probabilities. The Rao- 
Hartley-Cochran (RHC) method, like the method of 
selecting one unit per stratum, can be easily 
adapted to simple revision of the selection proba- 
bilities. 


Number of Sample Clusters: In rotating panel 
designs, it is desirable that each panel be a 
representative sub-sample of the population. The 
importance of this for the LFS is discussed further 
in Chapter 6. 


For each rotation group to be fully representative, 
the existence of six rotation groups implies that the 
sample selection method should permit the selec- 
tion of six clusters or a multiple of six clusters per 
stratum. Most of the unequal probability schemes 
suggested in the literature consider the selection 
of two units only, and in this sense would not be 
suitable for application in the SRUs of the LFS. 


Another option, which would still permit sample 
updating, would have been to have smaller strata 
with only one selection per stratum, and with 
representativity of rotation groups being achieved 
only over collections of strata. However, this was 
ruled out as being less desirable due to problems 
in representativeness of rotation groups, in esti- 
mation of variance, and in using rotation groups to 
select representative sub-samples for other sur- 
veys. 


Flexibility for Sample Size Changes: Since the 
LFS has undergone major sample redesigns only 
at ten year intervals, a critical design feature Is the 
flexibility to incorporate changes in the sample 
size. Such changes may be dictated by external 
factors such as shifts in government priorities or 
changes in the information needs to be satisfied 
by the survey. Or they may simply be neces- 
sitated due to technological changes in data 
collection resulting in more cost efficient methods. 
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3.3.3 Choix de la méthode de sélection 


On a choisi six (ou, dans des cas spéciaux, 12) grappes 


dans chaque strate par la methode de Rao, Hartley et Cochran 
(1962). On a conserve cette méthode pour les mémes raisons 


que celles qui 


avaient motive son adoption lors du 


remaniement de 1973, c’est-a-dire : 


a) 


Simplicite de la mise a jour : Etant donné que dans 
toute enquéte permanente fondée sur des méthodes de 
sondage aréolaire la taille des unites de sélection varie, le 
choix de la methode de sélection a utiliser dans le plan de 
sondage initial dépend beaucoup de la possibilite de 
reviser par la suite, par un procede simple, les proba- 
bilites de selection. Pour beaucoup de methodes de 
selection complexes impliquant deux sélections ou plus, 
la revision des probabilités de sélection initiales necessite 
des traitements complexes en raison des probabilites 
composées d’inclusion. La méthode de Rao, Hartley et 
Cochran (RHC), comme la méthode qui consiste a choisir 
une unite par strate, se préte bien a une revision simple 
des probabilites de sélection. 


Nombre de grappes d’échantillon : Dans les plans de 
sondage par panel avec renouvellement de |’echantillon, il 
est souhaitable que chaque panel soit un sous-echantillon 
representatif de la population. Nous parlerons davantage 
de l'importance de ce critere pour |'EPA dans le chapitre 
sur le renouvellement de |’echantillon. 


Comme il y a six groupes de renouvellement, pour que 
chacun soit parfaitement representatif, il faut que la 
methode de sélection de |'echantillon permette de choisir 
Six grappes (ou un multiple de six) par strate. La plupart 
des methodes de selection avec probabilites inegales pro- 
posées dans les ouvrages specialises n’envisagent que la 
sélection de deux unites; on a donc estime qu'on ne 
pouvait pas les appliquer aux UAR de |’EPA. 


Une autre methode, qui aurait aussi permis la mise a jour 
de |’échantillon, aurait consiste a former de petites strates 
et a ne faire qu'une sélection par strate, la represen- 
tativite des groupes de renouvellement etant obtenue sur 
plusieurs strates. Cette methode a cependant ete ecartee 
parce qu'elle a ete jugee moins interessante du fait 
qu'elle posait des problemes sur le plan de la repre- 
sentativite des groupes de renouvellement, de |’estimation 
de la variance et de l'utilisation des groupes de renouvel- 
lement pour la selection de sous-échantillons represen- 
tatifs pour d'autres enqueétes. 


Modification de la taille de l’échantillon : Comme le 
plan de sondage de |’EPA nest remanié en profondeur 
que tous les dix ans, il est tres important qu'il permette de 
modifier facilement la taille de l’echantillon. Ces modifi- 
cations peuvent etre rendues necessaires par des fac- 
teurs externes, comme un changement des priorités de 
Etat ou l’évolution des besoins en information que 
l’enquéte doit satisfaire, ou simplement par les progres 
technologiques dans le domaine de la collecte des 
données qui entrainent la mise au point de methodes plus 
economiques. 


The RHC method can readily accommodate 
changes in the overall sample size, or the alloca- 
tion of sample to stages, or both. This method has 
been adapted for the LFS to make it totally flexible 
both to changes in the overall sampling rate, and 
to changes in the number of random groups 
formed. This is discussed further in relation to 
sample updating. 


3.3.4 Sampling Methodology 


(a) 


Selection of Clusters: The selection of clusters 
using the RHC method is as follows. For a given 
stratum, let N = the number of clusters, R = the 
stratum inverse sampling ratio (isr), and n = the 
number of random groups (where n = 6, or 12 In 
special cases). Then the N clusters are randomly 
partitioned into n groups, containing either (N/n] or 
[N/n] + 1 clusters, where [x] refers to the greatest 
integer less than or equal to x. 


The expected number of dwellings for each group, 
Jj, iS Computed as 

D; 

d; = TO 


where D; is the number of dwellings in group j 
(Slee) 


The cluster inverse sampling ratio R,, was 
obtained for all clusters k in groupy as 


or 


where Dj, is the number of dwellings in cluster & of 
group yj, so that 


yy Rie = R. 
k 


Within each group, one cluster was selected with 
probability proportional to its size. 


Since the total sample size for the stratum, say m, 
is fixed (m = D/R, where D is the number of 
dwellings in the stratum), clearly, increasing the 
number of clusters selected will imply fewer 
dwellings per selected cluster. Studies were 
carried out at the time of redesign to determine an 
optimal allocation of the sample between the two 
stages of sampling. A cost model assuming a 
personal visit for dwellings in their first month in 
the sample and telephone interviews in_ later 
months was developed. Based on a variance 
component analysis and the cost model, optimal 
within-cluster sample sizes (or density factors) 
were found to be five to six dwellings in strata with 
blocks as clusters, and nine to ten dwellings in 
strata with EAs as clusters (Choudhry, Lee and 
Drew, 1985). 
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La méthode RHC se préte facilement a la modification de 
la taille globale de l’échantillon ou a la repartition de 
'échantillon selon le degré d’échantillonnage, ou aux 
deux. On a adapté la méthode a |'EPA de maniere a lui 
donner une souplesse absolue qu’il s’agisse de modifier 
la fraction de sondage globale ou le nombre de groupes 
aléatoires formés. Ces questions sont traitees plus loin 
dans le contexte de la mise a jour de |’echantillon. 


3.3.4 Méthodes d’échantillonnage 


a) 


Sélection des grappes : La sélection des grappes par la 
méthode RHC se fait de la facon suivante. Dans une 
strate données, soit N=le nombre de grappes, R = la 
fraction de sondage inverse de la strate (fsi) et n = le 
nombre de groupes aléatoires (ou n = 6 ou 12 dans les 
cas spéciaux). Les N grappes sont partitionnées au 
hasard en n groupes contenant /[N/n] ou [N/n] + 1 
grappes, ou (xj est le plus grand nombre entier inferieur 
ou egal a x. 


Le nombre prévu de logements dans chaque groupe, J, 
est calculé de la maniére suivante 


(6 ht ane 


ou D; est le nombre de logements dans le groupe j (j = 1, 
tea (be 


On obtient la fraction de sondage inverse des grappes Rj, 
pour toutes les grappes k d'un groupe j par la formule 


ou 
de maniére a ce que 


On choisit une grappe dans chaque groupe selon une 
probabilité proportionnelle a sa taille. 


Comme la taille de l’échantillon pour la strate, soit m, est 
fixe (m = D/R, Ou D est le nombre de logements dans la 
Strate), il est clair qu'une augmentation du nombre de 
grappes échantillonnées entraine une diminution du 
nombre de logements par grappe choisie. Des études ont 
été realisées au moment du remaniement du plan de 
sondage pour determiner la répartition optimale de 
'echantillon entre les deux degrés d’échantillonnage. En 
se fondant sur une analyse des composantes de la 
variance et sur un modéle de cotits supposant une visite 
sur place le premier mois qu'un logement participe a 
l'enquete et des interviews téléphoniques les mois 
suivants, on a trouvé que la taille optimale d’une grappe 
(ou facteur de densité) était de 5 ou 6 logements dans les 
Strates ou les ilots sont des grappes et de 9 ou 10 
logements dans les strates ot les SD sont des grappes 
(Choudhry, Lee et Drew 1985) 


To ensure density factors in the desired ranges, 
with a choice of n = 6, a constraint was that the 
sample yields should be in the range of 25-35 
dwellings for strata with a block-based design, and 
40-50 dwellings for strata with an EA-based 
design. Occasionally, when strata exceeded the 
usual size constraints, the choice of n = 12 


resulted in density factors closest to the desired 
values. 


(6) Sampling within Clusters 


Within selected clusters two random numbers, ry 
and rp, in the interval /1,R;,] are determined. The 
first of these r,, determines the number of 
occasions (i.€., six month periods) the selected 
cluster will remain in the sample before being 
replaced. The second, rz, determines the random 
Start to be used in selecting the initial systematic 
sample of dwellings from the cluster. On each of 
the (r,-1) successive sampling occasions within the 
cluster, the random start is incremented by 1, with 
Start 1 following start R,,. 


3.4 Sample Update Methodology 


Under the old LFS design, during the period from 
1975 to 1978, SRU design effects (i.e., the ratio of 
observed variances to expected variances under 
simple random sampling) had been increasing by 7- 
8% a year. In 1978, a program of sample updating was 
initiated, with sufficient intensity to arrest this 
deterioration during the period 1978-1982. The SRU 
update program was terminated coincident with the 
startup of work on the post-1981 Censal redesign. The 
SRU updating under the old design demonstrated the 
cost effectiveness of such updating as a means of 
maintaining desired levels of reliability for survey 
results. 


The key features of the RHC method for sample 
updating are that after formation of random groups, 
sampling is carried out independently within each 
random group, and that only one unit is selected with 
PPS per group. This permits a Keyfitz (1951) update, 
where new probabilities of selection can be incor- 
porated while maximizing the probability of retaining 
already selected units. Retention of already selected 
units is desirable, since it avoids the expense of initial 
creation and capture of dwelling lists associated with 
the selection of new clusters. During the sample 
updating from 1978-1982, originally selected clusters 
were retained 70% of the time. 


The update methodology consists of the following 
steps: 


(i) Obtain new counts for existing clusters in a 
stratum, with cluster breakdowns In the case of 
excessive growth. 
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Pour s’assurer que les facteurs de densité tombent dans 
les limites voulues lorsque n = 6, on a posé une condition 
relativement a la taille au moment de la stratification, a 
savoir que le rendement de |'échantillon soit de 25 a 35 
logements dans les strates ou l'unité de base est l'ilot et 
de 40 a 50 logements dans les strates ou |'unité de base 
est le SD. A l'occasion, lorsque la taille d'une strate 
depassait la limite établie, on a obtenu des facteurs de 
densité plus pres des valeurs voulues en prenant n = 12. 


b) Echantillonnage a lintérieur des grappes 


Dans les grappes choisies, on détermine deux nombres 
aléatoires r; et ro, dans l’intervalle /1,R,,J. Le premier de 
ces nombres, r;, represente le nombre de cycles (c.-a-d. 
de périodes de six mois) que la grappe choisie restera 
dans |’échantillon avant d’étre remplaceée et ry deéfinit 
l’origine choisie au hasard qui servira au prelevement du 
premier echantillon systematique de logements dans la 
grappe. A toutes les (r,-1) fois qu’on procede a 
l'echantillonnage dans la grappe, on ajoute 1 a I’origine 
choisie au hasard, l’origine R,, étant toujours suivie de 
lorigine 1. 


3.4 Méthode de mise a jour de |’échantillon 


Lorsqu’on utilisait ancien plan de sondage, entre 1975 et 
1978, l'effet du plan pour les UAR (c.-a-d. le ratio de la 
variance observee a la variance prevue selon |’echantillonnage 
aleatoire simple) augmentait de 7 a 8% par an. En 1978, un 
programme de mise a jour de |’echantillon a ete institue et il a 
ete suffisamment intensif pour qu’en 1982 cette deterioration 
ait cessé. Le programme de mise a jour de |’echantillon des 
UAR a pris fin au moment-meme ou l'on a amorce le rema- 
niement de |'EPA, apres le recensement de 1981. La mise a 
jour des UAR dans l’ancien plan de sondage a montre que 
cette facon de maintenir le degre de fiabilite des resultats de 
l’enquéte au niveau voulu etait economique. 


La principale caractéristique de la methode RHC du point 
de vue de la mise a jour de |'echantillon est que, apres la 
formation des groupes aléatoires, chacun de ces groupes est 
echantillonné independamment et seulement une unite y est 
choisie avec probabilité proportionnelle a la taille. Cette facon 
de proceder permet de faire une mise a jour par la methode 
de Keyfitz (1951), selon laquelle il est possible d'introduire de 
nouvelles probabilites de selection tout en maximisant la 
probabilite de garder les unites deja choisies. La raison pour 
laquelle on veut conserver ces unites est que cela evite les 
frais de creation et de saisie des listes de logements entraines 
par la sélection de nouvelles grappes. Lors de la mise a jour 
effectuee entre 1978 et 1982, on a gardé 70% des grappes 
qui avaient ete prelevees initialement. 


La méthode de mise a jour 
suivantes : 


comporte les etapes 


(i) Obtenir les nouveaux chiffres pour les grappes faisant 
déja partie de la strate, et les ventiler si la croissance a 
eté excessive. 


(ii) Re-cluster the cases with excessive growth. 


(iii) 


(iv 


— 


— 


Assign the new clusters randomly to groups such 
that the number of clusters per random group in 
the stratum remains constant. 


At this point random groups consist of say, N, old 
clusters retained at the time of updating, Nz» old 
clusters split into two or more new clusters at the 
time of updating, and N3 new clusters formed by 
splitting of old clusters in the stratum. 


The cluster isr (Rj,) is already defined for each of 
the N, + No units existing in the old design. For 
the N; new units, define R,, = 0. 


Similarly, define the new cluster isr R,,=0 for the 
Ny old clusters which were split up at the time of 
updating. For the N, + Nz new clusters, define 
revised isr’s in the same manner in which the old 
isr’s were defined, but based on the revised 
dwelling counts. 


Old and new probabilities of selection of clusters 
are given respectively by 


Rx 
a 
and 
egies 


A Keyfitz sample update is performed within each 
group using old and new probabilities of selection. 
The Keyfitz procedure incorporates the new proba- 
bilities of selection while maximizing the retention 
of already selected units. 


lf a cluster is retained, with R,, = R;,, then the within 
cluster sampling remains unaffected, both in terms 
of the number of occasions in which samples of 
dwellings will be drawn from the cluster, and in 
terms of the actual systematic samples used. 


lf a cluster is retained but R;, + Rj, then the 
length of time the cluster will remain in the sample 
is determined such that sampling can be restricted 
to previously unselected dwellings. Clustering of 
the systematic samples of dwellings drawn under 
the old and new cluster isr’s is then prevented by 
use of an algorithm which re-arranges the ordering 
of dwellings on the cluster list. 


3.5 Sample Design for the Apartment Frame 


A separate frame of apartment buildings exists for 


18 of the largest SRUs, namely Montreal, Toronto, 
Ottawa, Hamilton, London, Winnipeg, Calgary, 
Edmonton, Vancouver, Halifax, Quebec City, Oshawa, 
Windsor, Kitchener, Saskatoon, Victoria, Hull and St. 
Catharines. Changes from the previous design include 
the addition of Hull and St. Catharines, due to an 
increased number of high rise apartment dwelling units 
reported in the 1981 Census. 
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(ii) Former de nouvelles grappes la ou la croissance a éte 
excessive. Répartir les nouvelles grappes au hasard 
parmi les groupes de maniere que le nombre de grappes 
par groupe aléatoire dans la strate demeure constant. 


(iii) A ce stade-ci, les groupes aleatoires sont composes de, 
disons, N,; anciennes grappes qu'on a gardées lorsqu’on 
a fait la mise a jour, Ny anciennes grappes dont chacune 
a eté divisée en deux nouvelles grappes ou plus au 
moment de la mise a jour et N; nouvelles grappes 
formées lorsque les anciennes grappes de la strates ont 
été divisees. 
La fsi de la grappe (R;,) est déja définie pour chacune des 
N, + Ny unités de l’ancien plan de sondage. Pour les N; 
nouvelles unites, nous posons R;,, = 0. 


De méme, nous posons la nouvelle fsi de la grappe 
R,=0 pour les No anciennes grappes qui ont ete 
divisées lors de la mise a jour et, pour les N, + N; 
grappes, nous définissons les nouvelles fsi de la meme 
maniére qu’avant la mise a jour mais en fonction des 
nouveaux chiffres sur les logements. 


Les anciennes et les nouvelles probabilites d’echantillon- 
nage des grappes sont definies respectivement par 


Rj 
wire 
et 
y ik 
lane = eat 


(iv 


— 


On fait la mise a jour dans chaque groupe par la methode 
de Keyfitz en se servant des anciennes et des nouvelles 
probabilites de selection. La méthode de Keyfitz permet 
d'inclure les nouvelles probabilites d’éechantillonnage tout 
en maximisant la possibilite de garder les unites déja 
choisies. 


Si une grappe est conservee, et que Rj, = Rj, |’échan- 
tillonnage dans la grappe ne change pas, ni du point de 
vue du nombre de fois que des échantillons de logements 
seront preleves de la grappe ni du point de vue des 
échantillons systématiques utilisés. 


(v) Si une grappe est conservée mais que R,, * Rj, la 
période pendant laquelle la grappe restera dans |’échan- 
tillon est détermineée de maniére que |’échantillonnage soit 
limite aux logements qui n’ont jamais été choisis aupa- 
ravant. Pour eviter que les échantillons systématiques de 
logements prélevés au moyen des anciennes et des 
nouvelles fsi de grappe soient groupés, on utilise un 
algorithme qui refait l’ordre des logements dans la liste 
des grappes. 


3.5 Plan de sondage pour la base d’appartements 


ll existe une base de sondage distincte pour les 
immeubles d’appartements dans 19 des plus grandes UAR, 
soit Montreal, Toronto, Ottawa, Hamilton, London, Winnipeg, 
Calgary, Edmonton, Vancouver, Halifax, Québec, Oshawa, 
Windsor, Kitchener, Saskatoon, Victoria, Hull et St. Catharines. 
La constitution de ce genre de base pour Hull et St. 
Catharines est un des changements apportés par rapport a 
ancien plan, les résultats du recensement de 1981 ayant 
revele que le nombre d’unités de logements dans les grands 
immeubles d’appartements avait augmente dans ces villes. 


The apartment frame was initially adopted as a 
feature of the SRU design during the 1960s. Its 
principal benefit is to eliminate one of the major causes 
of growth in area frame clusters. Additionally it 
Improves representation in the sample of both 
apartment and non-apartment dwellers, who differ with 
respect to certain characteristics of interest. Stratifica- 
tion of the apartment frame is described in Chapter 2. 


The apartment frame is open-ended, and new 
apartment buildings that satisfy the criteria are added 
to the existing frame regularly, using data from Canada 
Post and the Central Mortgage and Housing Corpora- 
tion. The apartment frame was continuously updated 
under the old design. As such, its redesign was prin- 
cipally a matter of adjusting coverage to correspond to 
changes in the boundaries of the SRUs: apartment 
buildings were deleted in areas dropped from SRU 
coverage. 


For the added cities of Hull and St. Catharines, 
and for annexed portions of other cities, qualifying 
apartment buildings were initially identified by means 
of field checks. Another redesign operation included 
the plotting of apartment frame units on 1981 Census 
Tract maps. The identification of the block in which 
the apartment building was located was captured for 
use in the AMF areas in unduplicating the apartment 
and area frames. 


Within each size-geography stratum, the apart- 
ment buildings (clusters) were selected systematically, 
with probability proportional to size achieved by 
applying a pre-specified density factor of three. 
Dwellings, selected at the second stage of sampling, 
were chosen systematically using the procedure 
described for the area frame clusters. 
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C’est pendant les années 60 qu'on a ajouté les bases 
d’appartemenis au plan de sondage pour les UAR. Leur 
principal avantage est que, grace a elles, une des principales 
causes de la croissance des grappes dans la base aréolaire 
est éliminée. De plus, les personnes qui habitent dans un 
appartement et celles qui habitent dans un autre genre de 
logement, et qui different du point de vue de certaines 
caractéristiques a |’étude, sont ainsi mieux représentees dans 
l’echantillon. La stratification de la base d’appartements est 
décrite au chapitre 2. 


La base d’appartements est ouverte, ce qui veut dire que 
les nouveaux. immeubles qui repondent aux criteres y sont 
ajoutes regulierement, en fonction de renseignements prove- 
nant de la Société canadienne des postes et de la Societe 
canadienne d’hypotheques et de logement. Comme la base 
d’appartements etait continuellement mise a jour lorsque 
l’'ancien plan de sondage etait en vigueur, son remaniement a 
consisteé principalement a modifier sa composition pour tenir 
compte des changements apportes aux limites des UAR; on a 
notamment retire de la base des immeubles situes dans des 
regions qui ne faisaient plus partie de l’univers des UAR. 


Pour les villes de Hull et de St. Catharines et les secteurs 
qui ont été annexes a d'autres villes, on a tout d’abord repere 
les immeubles d’appartements pouvant figurer dans la base 
de sondage en faisant une verification sur le terrain. On a 
ensuite indique les unites de la base d’appartements sur les 
cartes des secteurs de recensement de 1981. Enfin, on a saisi 
identification des tlots dans lesquels les immeubles d’appar- 
tements étaient situes pour faire en sorte que, pour les 
régions non representées dans le FPR, les unites ne se 
retrouvent pas a la fois dans la base d’appartements et dans 
la base areolaire. 


Dans chaque strate definie selon un critere de taille et un 
critere geographique, on a choisi les immeubles d’apparte- 
ments (grappes) par la methode d’echantillonnage systema- 
tique avec probabilite proportionnelle a la taille en utilisant un 
nouveau facteur de densité dont la valeur etait de 3. Au 
deuxieme degré d’echantillonnage, on a choisi les logements 
par la méme methode d’echantillonnage systematique que 
celle qui a été appliquee aux grappes de la base areolaire. 


Tee ye - Myen, og 


~” ; : 
£5 7 ' 
oe, - a ee ee ee ee 
‘wee af Se CBee my hel) , tr ke A otheP ar 
+ nee aE Ge MND, OF MER) DSTA Hip. Peg! ne 
ihe: Game ela seeing = her SMe icidat «he van 
A); Seth ule iat“, > aap Vay ey Gage: al Med Ul. Sp pie ae me SEten', 
st dave whe da te Ria 6/9 Caliee, 1 a: a Aly Gel leg Rete tage Sis | ra ~~ wi 
ew in} 7 a> me iWin as Gi Pye Hp, dj - Te: eh) a ‘ 2 Ly m4 Fo we S VAP ey vr 
angt 92a aaah erat ivi, ‘foe Au? F “ini Nate + em a vee om pric wae baie 
by sorry apa ogee A al Hrarenis Gl Whet Hiway | ' 
; : , wea te sinsce . 


u 7 > 
: 7 ae 7 
at UR my ahhh ie ee sealMeh@ods l) C8? .4J an ree el a ih oe 
etl a a) hy) ‘Ws ie rape? «iy; ee ee vs! igi le ert) mph he 
Sh ee ee ee OO ee be eae $4 ne 
ity. ob Al 7 vag | weal ier D> i iar? int Minti ey eee 
i") Ww er rey Pig ar! Delt FRI SER Sal yal hu ly i 1D ee iso 
tLe | i ; L ‘ ap I i ' iY { mi 
f PE 4 eh) oo } pint eo tet ' 1 j i i Tel 
; is , PT tt as a ial | 1 ih Tt ep 
eonit ja © A Teed aL ay : 
i * ! L 4 Wee! il tio4 si aftice s 
7 we es i. oi! "epee ee ‘ 7 
> 
ery i uA AE Lop Selle & jia't } iy Vil So Soe eer ares 
anette nie, RAED Th E 4 cea tal) Vidi i'l at MHD SU Rt 2% > ere iw 
b> steer whet Th we Sates |) a. ng a 3 Whi \ i Gy aw Ta ony ag 
Ah hu IM ap! HALE! 9s Seg | Le niy sipbeaior (alia ie aa 
qe Sh STAT eG li Mee Sith SA \ to elie! / ‘ ( eleppeyt ity @ GPTD, rere ya ee if? r i 
0 Hike PS WI MAST.) AL ae) (mA Law i TR; my a Pint mi i 


Hi Wie ipo 4) SAa! rH eo By STB AG it Meyers at Y ioe vita ae : 
lai g ' Pane ii ia { nA HF, peril 1 Bow. Hain ptt H's a 
rei Au « , “ Deel ‘ : = 


Le orl P } a Ole 
7 ee 
: ‘ . ¢ 
bh 5 aie O) " % amp! ' : anect at } j ee aly) yen hiya 7 
hs « Alcea 9 a TaeRGnicne ails Wily itlyani ye ee a 
P ah m) (ee 3 met? ae ; , Vi) inh ae — 
5 inne CR Sige CStys jj t ' ; bt eli? <ipery Rp a en 


f y : Spee hi Grmay i Sr 1 eh a | A : lee? - V ihe Bi wt - May 
Neca ys Pad wa Sai oy lf 7 i iF ah iy ap ae ral *» , edi * yale Vitis 44>. OBO 
10 38 eat ie ao is tig ale Js } : ds “8 Se"! ‘ie i 
a ‘2 
oe 


RNS Na St 


a ie ha 
a "3 a 


4 


Chapter 4 


Non-Self Representing Areas 
4.1 Introduction 


The Non-Self Representing areas are those lying 
outside the Self Representing areas, and comprise 
rural areas and small urban centres. As noted earlier, 
a multi-stage sample design is used in NSR areas, 
where the sample within each Economic Region or 
Stratum has been concentrated into relatively few 
compact areas (Primary Sampling Units), each with a 
sample yield capable of supporting one interviewer. 
Such a clustered design was dictated by the low 
population density and the large land areas involved. 
Another influencing factor was that the area sampling 
methodology on which the survey is based requires 
interviewers to make personal visits to dwellings, at 
least during their first month in the sample. Some 
other considerations related to stratification and 
delineation of primary sampling units in NSR areas 
were given in Chapter 2. 


The redesign led to four major changes in the 
survey design in NSR areas, namely (i) the extension 
of telephone interviewing to NSR _ areas, (ii) the 
elimination of a stage of sampling in rural areas, (iil) the 
adoption of a design featuring expicit rural/urban 
stratification wherever feasible, and (iv) a special 
design for Prince Edward Island. The rationale behind 
each of these changes is briefly discussed in section 
4.2. 


The method of sampling PSUs described in 
section 4.3 is the same for each type of strata, namely 
Rural, Urban and Mixed. The subsampling methods for 
each of these strata types are then discussed in 
sections 4.4-4.6. Finally, the treatment of the special 
area sample is described in the last section. 


4.2 Rationale for Changes in the Design 


4.2.1 Extension of telephone interviewing 


Telephone interviewing for months two to six in the 
sample was introduced during the early 1970s in SR 
areas, primarily to reduce cost. However In NSR areas, 
all interviewing continued to be done in person. One of 
the concerns about telephone interviews was possible 
respondent resistance due to the nature of the data 
being collected and the prevalence of party lines. But 
in recognition of the immediate cost savings as well as 
the potential longer term gains from adoption of new 
telephone survey technologies, |t was decided to test 
the feasibility of extending telephone interviewing to 


NSR areas. 


Chapitre 4 


Unites non autoreprésentatives 


4.1. Introduction 


Les secteurs non autoreprésentatifs sont les secteurs 
situes a l'exterieur des secteurs autoreprésentatifs et sont 
formes de régions rurales et de petits centres urbains. 
Comme nous l’avons vu auparavant, on utilise un plan de 
sondage a plusieurs degres dans les secteurs NAR, |l’echan- 
tillon preleve dans chaque région économique ou strate y 
etant concentré en un nombre relativement faible de régions 
compactes (unites primaires d’échantillonnage ou UPE) qui 
ont chacune un rendement de |’echantillon correspondant a la 
tache d'un intervieweur. Un tel plan avec grappes a ete 
adopte en raison, premierement, de la faible densité de la 
population et des vastes etendues de terres dans ces secteurs 
et, deuxiemement, de la methode de sondage areéolaire sur 
laquelle repose l’enquéte et qui veut que les intervieweurs se 
rendent personnellement dans les logements au moins le 
premier mois de l’enquete. 


Le chapitre 2, sur la stratification, traite de quelques 
autres criteres qui sont entrées en ligne de compte relativement 
a la stratification et a la delimitation des unités primaires 
d’echantillonnage dans les secteurs NAR. Le remaniement du 
plan de sondage a entraineé quatre changements importants en 
ce qui a trait aux secteurs NAR : (i) les interviews telepho- 
niques ont ete etendues a ces secteurs; (ii) un degre d’echan- 
tillonnage a ete supprime dans les regions rurales; (iil) une 
stratification rurale/ urbaine explicite a ete adoptee partout ou 
cela a ete possible et un plan special a eté concu pour I'lle- 
du-Prince-Edouard. La raison de ces changements est brieve- 
ment expliquee a la section 2. 


La méthode d’échantillonnage des UPE decrite a la 
section 3 a ete appliquee aux trois sortes de strates, a savoir 
les strates rurales, urbaines et mixtes. Les methodes de sous- 
éechantillonnage utilisees pour chacune de ces sortes de 
strates sont decrites dans les sections 4 a 6. Enfin, le traite- 
ment de |’échantillon dans les secteurs speciaux fait l'objet de 
la derniere section. 


4.2 Raison des changements apportes au plan de 
sondage 


4.2.1 Interviews telephoniques 


Au debut des annees 70, on a commence a pratiquer 
l'interview telephonique aupres des menages echantillonnes 
dans les secteurs autorepresentatifs pendant les mois 2 a 6 
principalement dans le but de reduire les couts. Dans les 
secteurs NAR, on a continue de faire toutes les interviews sur 
place, car on craignait que les repondants ne s’opposent a 
l'interview telephonique en raison de la nature des donnees 
recueillies et du nombre eleve de lignes partagees par 
plusieurs abonnes. Toutefois, compte tenu des economies 
immédiates que le recours a l'interview telephonique ont 
permis de realiser ainsi que des autres avantages suscep- 
tibles d’en decouler a long terme, on a decide d’étudier la 
faisabilité d’étendre cette technique aux secteurs NAR. 


Field testing was carried out during 1982-84 on 
small portions of the actual LFS sample. Since the 
primary objective of the testing was to assess the data 
quality implications of the procedure, interviewer 
assignments were split between telephone and 
personal interviewing procedures. The test findings 
were that nonresponse rates were marginally lower for 
the telephone sample without any detectable difference 
in estimates for labour force characteristics. 


The decision to extend telephone interviewing led 
to an increase of about 10 to 15% in assignment sizes 
to an average of 55 to 65 dwellings. Also, rotation 
numbers were assigned in rural areas at a higher 
stage, so that within secondary units all dwellings 
received the same rotation number. This cut down on 
the number of visits to the secondary units in months 
two to six in the sample. 


4.2.2 Elimination of stage of sampling in rural 
areas 


In the old design, as mentioned in Chapter 1, the 
rural Sample within PSUs was selected in three stages: 
secondaries (called groups), clusters, and dwellings. 
The clusters corresponded to identifiable land areas 
containing up to 20 dwellings, which were delineated 
on the basis of field counts obtained whenever a new 
group entered the sample. Within groups, generally 
five to six clusters, with three to four dwellings per 
cluster, were selected. 


The rural cluster stage was identified early in the 
redesign program as a possible candidate for elimina- 
tion, on the grounds that (i) the sample variance would 
be reduced due to having one less stage of sampling, 
and (il) the lead time required to introduce new groups 
into the sample could be shortened from 13 months to 
7 months to facilitate using the LFS frame for other 
household surveys. 


A field study was carried out on a sample of 
groups entering the LFS sample. The study assessed 
the feasibility of maintaining good quality dwelling lists 
for entire rural EAs, and examined costs under such a 
procedure, with positive results on both counts. The 
variance implications of eliminating the cluster stage 
were also studied. Using 1971 Census data to simulate 
both the old and alternative design, components of 
variance were obtained for the Horvitz-Thompson 
estimator without ratio estimation. The percent 
reduction in total NSR variance under the alternative 
design was found to range from 20%-25% for major 
labour force characteristics (Choudhry, Lee and Drew, 
1985). 
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Les essais sur le terrain ont eu lieu pendant la période 
1982-1984 auprés d'un petit nombre de menages qui faisaient 
partie de |’échantillon de |'EPA a ce moment-la. Comme le 
principal objectif de l’essai etait d’evaluer les Consequences 
que le changement de technique aurait sur la qualite des 
données, on a divisé la tache des intervieweurs en deux, une 
moitié des interviews devant étre faites par telephone et 
l'autre moitié, sur place. Il est ressorti de l’essai que les taux 
de non-réponse étaient legérement inférieurs pour |’éechantillon 
interviewé par téléphone et qu'il n'y avait pas de differences 
perceptibles dans les estimations relatives aux caractéris- 
tiques de la population active. 


La décision d’étendre les interviews telephoniques a eu 
deux conséquences : une augmentation de la tache de |’ordre 
de 10 a 15%, portant cette derniére a 55 a 65 logements en 
moyenne, et l'attribution de numeros de renouvellement au 
premier degre d’échantillonnage dans les regions rurales pour 
que tous les logements dans les unités secondaires recoivent 
le méme numéro, de maniere a réduire le nombre de visites 
dans ces logements pendant les mois 2 a 6 du cycle ou ils 
faisaient partie de |’echantillon. 


4.2.2 Elimination d’un degré d’échantillonnage dans les 
regions rurales 


Dans l’ancien plan de sondage, il y avait trois degres 
d’échantillonnage pour les régions rurales des UPE : on 
prelevait d’abord les unites secondaires (secteurs de denom- 
brement du recensement), puis les grappes, et enfin les loge- 
ments. Les grappes correspondaient a des superficies identi- 
fiables comptant jusqu’a 20 logements, et leurs limites étaient 
etablies en fonction des resultats du denombrement sur le 
terrain effectue chaque fois qu’une nouvelle unite secondaire 
etait introduite dans |’échantillon. Dans les unites secondaires, 
on prélevait genéralement 5 ou 6 grappes comprenant 3 ou 4 
logements chacune. 


On a determine des le début du programme de rema- 
niement que le degre d’échantillonnage des grappes dans les 
regions rurales pourrait étre éliminé pour les raisons 
suivantes: (i) la variance de l’echantillon diminuerait du_ fait 
qu'il y aurait un degré d’échantillonnage de moins et (ii) le 
preavis requis avant lintroduction des nouvelles unites 
secondaires dans |’échantillon pourrait étre reduit de 13 a 7 
mois de maniere a faciliter l'utilisation de la base de sondage 
de l'EPA aux fins d’autres enquétes- menages. 


Une étude sur le terrain a été menée auprés d’un 
echantillon d’unités secondaires qui entraient dans |’échan- 
tillon de l'EPA en vue de déterminer s'il était possible de tenir 
a jour des listes de logements de bonne qualité pour des SD 
ruraux entiers et combien il en couterait de le faire. Les 
resultats ont été positifs aux deux points de vue. On a 
également étudié |’effet sur la variance de |’élimination du 
degre d’éechantillonnage des grappes. En se servant des 
données du recensement de 1971 pour simuler a la fois 
l'ancien plan de sondage et celui qu'on envisageait, on a 
obtenu les composantes de la variance pour |’estimateur 
d’Horwitz-Thompson sans estimation par quotient. On a 
trouve que la reduction en pourcentage de la variance totale 
dans les secteurs NAR si l'on appliquait le plan de sondage a 
"etude serait de 20 a 25% pour les principales caracté- 
Hees de la population active (Choudhry, Lee et Drew 
1985). 


4.2.3 Design with urban/rural stratification 


The design during the 1970s was the mixed 
design described earlier. Under this design both strata 
and PSUs were mixtures of urban and rural areas, with 
the attempt to maintain the stratum proportion of rural 
and urban for individual PSUs. A premise underlying 
this design was that the PSU should correspond to an 
interviewer's assignment. However, in practice this 
correspondence is weakened since, in order to attain 
the desired urban/rural ratio, the urban and rural 
portions of PSUs cannot always be made contiguous. 


As an alternative to this mixed type design (with 
the rural cluster stage eliminated), the design featuring 
explicit rural/urban_ stratification was studied. Under 
this design, PSUs in both rural and urban strata are 
designed to yield full interviewer assignments. 
Although this design features more clustering, parti- 
cularly of the urban sample, it was suspected that any 
increase in variance would be offset by reduction in 
costs due to the more compact PSUs. 


Variances under the two designs were studied 
using Census data for simulation purposes. Also cost 
implications of the new design were studied. This was 
achieved using results of a detailed Time and Cost 
Study and by simulating the dispersion of the sample 
under the two designs up to the second stage of 
sampling using population centroids of Enumeration 
Areas. 


A priori expectations were confirmed, and the 
urban/rural design was found to outperform the old 
design from a combined cost-variance perspective 
(Choudhry, Lee and Drew, 1985). 


4.2.4 Special design for Prince Edward Island 


For Canada’s smallest province, Prince Edward 
Island, sampling rates of 4% are required to produce 
monthly labour force estimates with required levels of 
data reliability. In view of the high sampling rates, a 
less clustered design consisting of a two-stage sample 
of EAs and dwellings with a deep geographic stratifica- 
tion was adopted. EAs were chosen as stratification 
units, without regard to rural/urban distinctions, since 
the urban centres were small and were similar in 
characteristics to adjacent rural EAs. A total of 12 
strata were formed. From each stratum, six EAs were 
chosen with an average sample yield of 17 dwellings 
per EA. 


4.3 Selection of Primary Sampling Units 


As described earlier, the composition of NSR 
Primary Sampling Units differed for the three principal 
types of strata. In rural strata, PSUs were collections 
of geographically compact EAs, in urban strata they 
were individual or combined urban centres, and in 
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4.2.3 Plan avec stratification urbaine/rurale 


Le plan des années 70 était, comme nous !’avons vu, un 
plan mixte selon lequel on trouvait tant dans les strates que 
dans les UPE a la fois des régions urbaines et des regions 
rurales, et on essayait de faire en sorte que le ratio de la 
population rurale a la population urbaine dans chaque UPE 
soit le méme que celui dans la strate. Un des buts recherche 
etait qu'une UPE corresponde a la tache d'un intervieweur. 
Toutefois, en pratique, cette correspondance ne pouvait pas 
toujours étre obtenue, car, pour avoir le ratio urbain-rural 
voulu, il fallait souvent former des UPE dont la partie urbaine 
et la partie rurale n’étaient pas contigués. 


On a étudié comme solution de rechange a ce plan mixte 
un plan de sondage avec stratification rurale/urbaine explicite 
(et elimination du degré d’échantillonnage des grappes dans 
les regions rurales). Selon ce plan, les UPE sont concues de 
maniere a donner un echantillon correspondant a la tache 
complete d’un intervieweur a la fois dans les strates rurales et 
dans les strates urbaines. Bien que cela implique une 
augmentation de la taille des UPE, particulierement dans 
l'echantillon urbain, on soupconnait que toute augmentation de 
la variance serait compensee par une diminution des couts du 
fait que les UPE seraient plus compactes. 


On a compare les variances obtenues selon les deux 
plans de sondage en simulant ces derniers a |’aide des don- 
nees de recensement. On a aussi étudié les couts qu’entrai- 
nerait le nouveau plan de sondage d’apres les resultats d'une 
analyse temps-couts detaillee et en simulant la dispersion de 
l'echantillon dans les deux plans de sondage jusqu’au 
deuxieme degre d’échantillonnage au moyen des coordon- 
nees des endroits, dans les secteurs de denombrement, ou la 
population etait elevee. 


Les hypotheses posées a priori ont ete confirmees et le 
plan urbain/rural s’est avere plus performant que |’ancien plan 
tant du point de vue des couts que du point de vue de la 
variance (Choudhry, Lee et Drew 1985). 


4.2.4 Plan special pour V'lle-du-Prince-Edouard 


Pour la plus petite province du Canada, |'lle-du-Prince- 
Edouard, il faut avoir des taux de sondage de 4% pour 
produire des estimations mensuelles de |'EPA atteignant le 
niveau de fiabilité voulu. Comme il faut des taux de sondage 
si eleves, on a adopte un plan prevoyant un plus grand 
nombre de petites grappes qui consistait en un echantillon a 
deux degres de SD et de logements et supposait une 
stratification geographique detaillee. On a pris les SD comme 
unites de stratification sans se preoccuper de la distinction 
rurale/urbaine, car les centres urbains etaient petits et avaient 
des caractéristiques semblables a celles des SD ruraux 
voisins. Douze strates ont ete formees en tout. Six SD ont ete 
préleves dans chaque strate et chaque SD avait en moyenne 
un rendement de |’echantillon de 17 logements. 


4.3 Sélection des unites primaires 
d’echantillonnage 


Comme nous |l’avons vu dans le chapitre sur la strati- 
fication, la composition des unites primaires d’echantillonnage 
dans les secteurs NAR variait dans chacune des trois 
principales sortes de strates. Dans les strates rurales, les 
UPE étaient des ensembles de SD compacts du point de vue 


mixed strata they were collections of geographically 
compact rural EAs, together with one or more nearby 
urban centres or portions thereof. 


Regardless of the stratum type, the methodology 
for selection of PSUs was the same. As was the case 
in the previous LFS design, the Randomized Proba- 
bility Proportional to Size Systematic (RPPSS) method 
due to Hartley and Rao (1962) was used. Principal 
reasons for the choice of the method are its flexibility 
to accommodate rotation of sampling units, and to 
accommodate changes in the sample size through 
increase or decrease in the number of sampled units. 


In each stratum, either two or three PSUs were 
selected, whichever resulted in an expected sample 
yield per PSU closer to the desired 55-65 dwellings. 
Determination of the number of PSUs to be selected 
per stratum and the actual sampling procedure is as 
follows. Denoting 


R, = the within stratum inverse sampling rate 
D, = the number of dwellings in stratum h 
D;, = the number of dwellings in PSU stratum h 


the number of PSUs to select n, (= 2 or 3) was 
determined as 


D, 
a Ry 


Np 
where d, is the expected sample size and is as 
close as possible to 55-65 dwellings. 


Selection of the n, PSUs then proceeded as 


follows: 

(i) Within each stratum the list of PSUs is 
randomized. 

(i) The inverse sampling ratio for each PSU is 


calculated as 


RpN,Din 
D, 


or 


so that 
yy Rin = 1,Rp 
i 


(Here [x] refers to the greatest integer part of x.) 


(ii) Using R, as the size measure, R, as the sampling 
interval, and by choosing a random _ integer 
rii<r,<R,), a pps systematic sample of n, 
PSUs is selected from each stratum. 
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géographique, dans les strates urbaines, elles étaient 
constituées d’un ou de plusieurs centres urbains et, dans les 
strates mixtes, elles étaient formées de quelques SD ruraux 
compacts sur le plan géographique et d’un ou de plusieurs 
centres urbains adjacents, certains entiers et d'autres non. 


La méthode utilisée pour le prélevement des UPE a ete la 
méme quel que soit le type de strate. Comme dans |’ancien 
plan de sondage de |'’EPA, on a pris la méthode d’échan- 
tillonnage systématique avec classement aléatoire et proba- 
bilité proportionnelle a la taille (ESCAPPT) que l’on doit a 
Hartley et Rao (1962). La principale raison qui a motive ce 
choix est la souplesse de cette méthode quand il faut pro- 
céder au renouvellement des unites d’echantillonnage ou 
modifier la taille de l’échantillon en augmentant ou en 
diminuant le nombre d’unites echantillonnees. 


Dans chaque strate, on a choisi 2 ou 3 UPE, selon ce qui 
permettait d’obtenir un rendement prévu de |’echantillon par 
UPE qui s'approchait le plus des 55 a 65 logements voulus. 
On a déterminé le nombre d’UPE a prelever dans chaque 
strate et procédé a |’échantillonnage de la maniere suivante. 
Soit 


R, = la fraction de sondage inverse a l'interieur de la strate 
= le nombre de logements dans la strate h 
D,, = le nombre de logements dans |’UPE |, strate h 


On a déterminé le nombre d’UPE a prelever n,(= 2 ou 3) 
par la formule 


Di, 


ne 
eae 


ou d, est la taille prevue de |’échantillon et se rapproche 
le plus possible de 55 a 65 logements. 


Pour prélever les n, UPE, on a procédé de la maniére 
suivante : 


(i) A Vinterieur de chaque strate, on a randomisé la liste des 
WIPE. 


(ii) On a calculé la fraction de sondage inverse pour chaque 
UPE par la formule 


Ry = [Se 
Dy 


[| 
———| +1 
D, 


de maniere a ce que 
y3 Ri, = 1,R, 


1 


Ou 


Ici, ([x] représente la partie entiére de x.) 


(ili) En prenant les R;, comme mesures de la taille et Ry, 
comme pas de sondage et en choisissant un nombre 
entier aleatoire r_(1 <r, <R,), on a préleve dans chaque 
strate un échantiflon systematique avec ppt de n, UPE. 


4.4 Sub-Sampling in Rural Strata 
4.4.1 Sampling within Primary Sampling Units 


. The secondary Sampling unit (SSU) in rural strata 
is termed the group. A group generally corresponds to 
a 1981 Census Enumeration Area, with some col- 
lapsing in case of EAs with low dwelling counts, and 
with splitting of EAs with high counts. The rules 
governing combining and splitting of EAs were that 
EAs with less than 20 dwellings were collapsed with a 
neighboring EA, while EAs whose dwelling count was 
more than one-third of the dwelling count for the PSU 
were split into parts having similar dwelling counts. 
The splitting was done using recognizable physical 
featureson topographical maps, with the number of 
dwellings per split portion being estimated on the basis 
of the dwellings plotted on the topographical maps. 


As described earlier, average populations of PSUs 
differed substantially depending on the province and to 
a lesser extent on the Economic Region within 
province. The different PSU populations led to different 
within-PSU sampling rates in order to achieve the 
desired sample yields of 50-60 dwellings. Further, it 
was desired to select between 10-20 dwellings per 
group, a design parameter that was left unchanged 
from the previous design, and was meant to represent 
the workload an interviewer could be expected to 
handle in one day’s work. The fixed yields per PSU 
and per SSU combined with different strata and PSU 
sizes across the country, led to dramatically different 
second stage sampling rates ranging from a sub- 
sampling rate of close to 1 in the Atlantic Provinces 
(excluding Prince Edward Island where a_ special 
design was adopted), to sampling rates of close to 1/3 
in Quebec and Ontario. 


Selection of groups followed the same method 
used for PSUs, namely, the randomized PPS syste- 
matic method. The first step was to randomly order the 
rural groups for the selected PSU. 


Next, n,,,the number of groups to select per PSU 
was determined as follows: 


(i) If N,,, the number of groups in PSU,,is 5 or less, 
then select all of them. 


(ii) If the PSU,,has 6 or more groups, select 3 groups 
if this results in an expected sample yield of 20 or 
less, otherwise select 6 groups. The rationale for 
selection of 3 or 6 groups relates to assignment of 
rotation numbers as discussed in the next chapter. 


(iii) If the proportion of groups selected via rule (ii) is 
greater than or equal to two-thirds, then select all 


groups. 


41 


4.4 Sous-échantillonnage dans les strates rurales 
4.4.1 Echantillonnage dans les UPE 


L'unité secondaire d’échantillonnage (USE) dans les 
Strates rurales s’appelle le groupe. Un groupe correspond 
generalement a un secteur de dénombrement du recensement 
de 1981, mais il peut s’agir de plusieurs SD dans lesquels le 
nombre de logements était faible et que l'on a réunis ou 
encore d'une partie d'un SD dans lequel le nombre de 
logements etait élevé. Les criteres sur lesquels on s'est basé 
pour determiner s'il fallait grouper ou diviser les SD étaient les 
suivants : les SD dans lesquels il y avait moins de 20 
logements ont été rattachés a un SD adjacent et les SD dans 
lesquels le nombre de logements était supérieur au tiers du 
nombre de logements dans |'UPE ont été diviseés en parties 
plus ou moins égales du point de vue du nombre de 
logements. La division a éte faite en fonction des accidents de 
terrain reconnaissables sur les cartes topographiques, le 
nombre de logements par partie formee étant estime d’apres 
les indications a cet effet figurant sur ces cartes. 


Comme nous |’avons deja vu, la population moyenne des 
UPE variait nettement selon la province et, a l'intérieur des 
provinces, quoique dans une moindre mesure, selon la region 
economique. A cause de cette variation, il a fallu prendre des 
fractions de sondage différentes dans les UPE pour obtenir le 
rendement de |’echantillon voulu, soit 50 a 60 logements. En 
outre, on voulait prelever de 10 a 20 logements par groupe, 
comme dans l’ancien plan de sondage, car on estimait que 
c'éetait la la charge de travail qu’un intervieweur pouvait 
accomplir en une journée. Le fait que le rendement de 
l’echantillon dans les UPE et les USE etait fixe et que la taille 
des strates et des UPE etait differente d'un bout a l'autre du 
pays a entrainé une fluctuation marquée des fractions de 
sondage au deuxieme degre d’echantillonnage, lesquelles ont 
varie de pres de 1 dans les provinces de |’Atlantique 
(exception faite de |'lle-du-Prince-Edouard ou on a employe 
un plan special) a pres de 1/3 au Quebec et en Ontario. 


On a applique la méme methode pour preélever les USE 
ou groupes que pour les UPE, soit la methode d'echan- 
tillonnage systematique avec classement aleatoire et ppt. La 
premiere etape a consiste a mettre dans un ordre aleatoire les 
groupes ruraux dans les UPE choisies. 


On a ensuite determine n,,,!€ nombre de groupes a 
prelever par UPE, de la maniere suivante : 


(i) Si N,,,l€ nombre de groupes dans une UPE,, est egal ou 
inférieur a 5, prelever tous les groupes. 


(ii) Si TUPE,, compte 6 groupes ou plus, prélever trois 
groupes si cela permet d’obtenir un rendement prevu de 
l'echantillon de 20 logements ou moins; autrement, prele- 
ver 6 groupes. La raison pour laquelle on prend 3 ou 6 
groupes est liee a |'attribution des numéros de renou- 
vellement, dont il est question dans le prochain chapitre. 


(iii) Si la proportion de groupes préleves par la regle (ii) est 
egale ou supérieure aux deux tiers, prelever tous les 
groupes. 


When all groups in a PSU are selected, the PSU 
inverse sampling ratio R,,is adopted as the inverse 
sampling ratio for each group. Where only a_ fraction 
of the groups are selected, the inverse sampling ratio 
R,,,\S determined as the greatest integer part of 


Mi Dri R pi 
Dyhi 
or 
Ani Dig Ri 
Dri 
chosen so that 
5 Rng = MnRni 
j 


4.4.2 Selection of dwellings 


The procedure followed for the selection of 
dwellings within the selected groups in the NSR areas 
is same as that used within the clusters in the SR 
areas, that is, dwellings are selected systematically by 
applying a random start and a sampling interval equal 
to the inverse sampling ratio of the selected group. 


4.5 Sub-Sampling in Urban Strata 
4.5.1 Clustering of urban centres 


Primary sampling units in urban strata comprise 
generally one, but sometimes two or three urban 
centres. Within selected urban PSUs, each urban 
centre is clustered, and sampled separately at the PSU 
sampling rate. 


At the time of the sample redesign, procedures for 
clustering of NSR urban areas were the same as those 
followed for the smaller SRUs lying outside the block 
face coverage; that is, for the most part, 1981 Census 
visitation records were used to establish dwelling 
counts, with field counting being resorted to whenever 
the visitation records or accompanying maps lacked 
sufficient detail. 


NSR urban clusters in general contained fewer 
dwellings than those in SR areas. Minimum cluster 
sizes were set at three dwellings, with maximums of 
three times the PSU inverse sampling ratio. 


4.5.2 Selection of clusters 


Clusters are selected independently from each 
urban centre belonging to the sampled PSUs using the 
randomized pps systematic method. Steps in cluster 
selection are as follows: 


(i) Within each selected urban centre, the list of 
clusters is randomized. 
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Lorsque tous les groupes dans une UPE sont choisis, la 
fraction de sondage inverse de I’UPE R,,, devient la fraction de 
sondage inverse de chaque groupe. Lorsqu’une partie 
seulement des groupes est choisie, on determine les fractions 
de sondage g R,,; en prenant la partie entiere de 


Ani Dri R ri 
Dyj 
Ou 
AnD Ri 
Dri 
de maniére a ce que 


Ne Ry = Mi Rni 
J 


4.4.2 Selection des logements 


Pour prélever les logements dans les groupes choisis 
dans les secteurs NAR, on a procedé de la meme maniere 
que pour les logements dans les grappes dans les secteurs 
AR, c'est-a-dire qu'on a choisi les logements systematique- 
ment en prenant une origine aleatoire et un pas de sondage 
égal a la fraction de sondage inverse des groupes choisis. 


4.5 Sous-échantillonnage dans les strates urbaines 
4.5.1 Formation des grappes dans les centres urbains 


Les unites primaires d’échantillonnage sont géneralement 
formees d’un centre urbain, mais tl arrive qu’elles en com- 
prennent deux ou trois. Dans les UPE urbaines choisies, on 
forme les grappes et on preleve |’échantillon separément dans 
chaque centre urbain en appliquant la fraction de sondage de 
LURES 


Au moment du remaniement du plan de sondage, la mé- 
thode utilisee pour former les grappes dans les centres 
urbains des secteurs NAR etait la meme que celle dont on se 
servait pour les petites UAR ou !l’unite de sondage n’était pas 
le cote d’ilot. Autrement dit, dans la plupart des cas, on s'est 
servi des registres des visites du recensement de 1981 pour 
etablir les chiffres sur les logements et on a eu recours au 
déenombrement sur le terrain lorsque les registres des visites 
ou les cartes qui les accompagnaient n’étaient pas suffisam- 
ment detaillees. 


En general, les grappes dans les centres urbains des 
secteurs NAR contenaient moins de logements que celles 
dans les secteurs AR. La taille minimum d'une grappe a eté 
fixee a 3 logements et la taille maximum, a 3 fois la fraction de 
sondage inverse de |’UPE. 


4.5.2 Selection des grappes 


On a préleve les grappes de facon indépendante dans 
chaque centre urbain faisant partie d’une UPE échantillonnée 
par la methode d’échantillonnage systématique avec classe- 
ment aleatoire et ppt. La sélection des grappes s'est faite 
selon les etapes suivantes : 


(\) Dans chaque centre urbain choisi, on randomise la liste 
des grappes. 


(ii) The desired expected sample yield (or density 
factor, d) is taken as three dwellings per cluster. 
The number of clusters to select in PSU , , stratum 
h , urban centre jis determined as 


where the density factor is as close as possible to 3. 


(iil) Letting z denote a cluster, all clusters for which the 
number of dwellings D,,,, was greater than or 
equal to 24 Dpjjx/Npy were selected with certainty, 
and were assigned an inverse sampling ratio equal 
to that for the PSU. 


(iv) For the remaining clusters an inverse sampling 
ratio, Ry,,,was obtained as the greatest integer 


part of 
Drie Rij 
a* hy 
or 
DnhijR rij 
Pel, 
a* i 


where d,,,was defined analogously to d,,,, but only 
for those np, clusters not selected with certainty. 
The individual R,;;,'s calculated at this step were 
chosen to total ny, R,,,. 


(v) Using R,,;,as the cluster size, a systematic sample 
of clusters was selected in the usual manner. 


4.6 Sub-Sampling in Mixed Strata 


In mixed strata, rural and urban portions of the 
selected PSUs are sampled separately. This, together 
with the design constraint that all PSUs within a 
stratum have roughly equal proportions of rural and 
urban population, amounts to an implicit urban rural 
stratification. 


The sampling of rural portions of the PSUs 
proceeds in a very similar fashion to the sampling of 
PSUs in rural strata, with the exception that two or four 
selected groups are generally aimed for (instead of 
three or six), since the rural portions of mixed PSUs 
have correspondingly fewer dwellings. 


The sampling of urban portions of PSUs also 
proceeds similarly to the sampling of urban PSUs, 
although special steps are necessary for treatment of 
urban centres which, when designing PSUs, were frac- 
tionally associated with two or more PSUs. 
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(ii) On prend comme rendement prévu de |’échantillon voulu 
(ou facteur de densité d) trois logements par grappe. On 
determine le nombre de grappes a choisir dans |'UPE ,, 
strate h, centre urbain j par la formule 


Dy 


qi aa 
MGR ri 


ou le facteur de densité se rapproche autant que possible de 
3: 


(iii) Soit k étant la grappe, on choisit avec une probabilité 
egale a 1 toutes les grappes ou le nombre de logements 
D,,;, est supérieur ou egal Z, D,,,,/n,,,a et on leur attribue 
une fraction de sondage inverse egale a celle de |'UPE. 


= 


On attribue aux grappes restantes la fraction de sondage 
inverse R,,,,,Qu’on obtient en prenant la partie entiere de 


Ou 


ou l'on definit d,,, de fagon analogue a d,,,, mais 
seulement pour les n,,, grappes non choisies avec une 
probabilite egale a 1. Les R,,,, calculees a cette etape-ci 
sont corrigees de nouveau pour que leur somme soit 
egale a ny, R,j. 


v) En prenant R,,,,comme taille des grappes, on preleve un 
echantillon systematique de grappes de la maniere habi- 
tuelle. 


4.6 Sous-echantillonnage dans les strates mixtes 


Dans jes strates mixtes, les parties rurales et urbaines 
des UPE choisies sont eéchantillonnées separement. Cette 
facon de proceder, ainsi que la contrainte etablie dans le plan 
de sondage selon laquelle le ratio de la population rurale a la 
population urbaine soit a peu pres egal dans toutes les UPE 
d'une strate, @quivaut a une stratification urbaine/rurale 
implicite. 


L’échantillonnage des parties rurales des UPE se fait de 
facon tres semblable a |’echantillonnage des UPE dans les 
strates rurales, sauf qu’on cherche a prelever 2 ou 4 groupes 
(plutdt que 3 ou 6) du fait qu'il y a moins de logements dans 
la partie rurale des UPE mixtes. 


L’echantillonnage des parties urbaines des UPE se fait 
aussi de facon semblable a l'echantillonnage des UPE dans 
les strates urbaines, sauf qu'il faut prendre des mesures 
speciales a l'egard des centres urbains qui ont ete divises au 
moment de la formation des UPE et associés a deux UPE ou 
plus. 


In such cases, the entire urban centre is clustered 
in the usual fashion. Say the urban centre is divided 
into m parts at the PSU delineation stage, which are 
assigned to m* PSUs (with m* <m, since some PSUs 
may have received more than one part). Then the 
clusters are randomly assigned to each one of these 
parts. The partitioning was done to equalize the 
number of dwellings, as opposed to the number of 
clusters. Each PSU sharing the urban centre was then 
assigned one or more parts as required. 


The clusters assigned to the selected PSU in this 
fashion were sampled at the PSU inverse sampling 
rate using the same procedures as described earlier 
for urban strata. 


4.7 Sample Design for Special Areas 


Remote areas of most provinces, and institutions, 
such as hospitals, schools and military establishments 
were designated as Special Areas. For sampling 
purposes, the special areas are divided into two parts: 
(1) Remote Areas, and (2) Institutions, which are 
sampled independently. 


Remote areas, consisting of the northernmost 
parts of all provinces except Prince Edward Island, 
Nova Scotia and New Brunswick, cover a vast land 
area but contain less than 1% of the population. For 
military establishments and institutions only the civilian 
non-inmate population is included in the survey. 


4.7.1 Rationale for special areas 


Two primary reasons for sampling the Special 
Areas separately from the regular (SR and NSR) areas 
were: 


(1) The population living in these areas possesses 
characteristics differing from those of the rest of 
the population and therefore, if it were included in 
the regular areas, the sampling variance would 
increase. Further, if not segregated, the special 
areas would introduce instability into the sample 
estimates, especially at the time when units rotate 
in or out. 


(li) There have been instances when, due to inacces- 
sibility or weather, the method and/or the 
frequency of data collection has had to be mo- 
dified. For example, interviews may be collected 
only once in a six-month cycle, with the data being 
carried forward during intervening months. 


4.7.2 Design of the remote areas 


Each of the most northerly Economic Regions of 
those provinces with remote areas were examined 
individually. Cities with unique characteristics (such as 
Fort McMurray, Flin Flon, The Pas, Thompson and 
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Dans ces cas-la, le centre urbain entier est reparti en 
grappes de la maniere habituelle. Supposons que le centre 
urbain a été divisé en m parties a l’etape de la delimitation des 
UPE et que celles-ci ont été attribuees a m* UPE (OU m* <™m, 
car il se peut qu’ont ait attribué plus d’une partie a certaines 
UPE). On a ensuite attribué les grappes au hasard a chacune 
des m parties. Le but de la partition etait d’egaliser le nombre 
de logements, par opposition au nombre de grappes par 
parties. On a ensuite attribué a chacune des UPE qui se 
partageaient le centre urbain une ou deux parties selon le 
besoin. 


On a échantillonné les grappes attribuees de cette 
maniére aux UPE choisies en appliquant la fraction de 
sondage inverse de |’UPE et en utilisant la meme methode 
que celle que nous avons décrite dans la section sur les 
strates urbaines. 


4.7 Plan de sondage pour les secteurs spéeciaux 


On a décidé que les régions eloignees de la plupart des 
provinces et les établissements institutionnels comme les 
hdpitaux, les maisons d’enseignement et les etablissements 
militaires constituaient des secteurs speciaux. Pour les 
besoins de |’échantillonnage, on a divisé les secteurs speciaux 
en deux catégories, les régions éloignées et les eétablis- 
sements institutionnels, qu’on a echantillonnees separement. 


Les régions éloignées, qui representent la partie la plus 
au Nord de toutes les provinces a l'exception de I'lle-du- 
Prince-Edouard, de la Nouvelle-Ecosse et du Nouveau- 
Brunswick, ont une vaste superficie mais comptent moins de 
% de la population. En ce qui concerne la population des 
éetablissements militaires et des établissements institutionnels, 
seuls les civils et les personnes autres que les pensionnaires 
de ces etablissements ont ete inclus dans |’enquete. 


4.7.1 Raison d’etre des secteurs spéciaux 


Les deux principales raisons pour lesquelles les secteurs 
speciaux ont éte échantillonnés separement des secteurs nor- 
maux (AR et NAR) étaient les suivantes : 


(i) La population de ces secteurs possede des caractéris- 
tiques differentes de celles de la population en general. 
Par consequent, si on avait inclus ces secteurs avec les 
autres, la variance d’échantillonnage aurait été plus 
grande. Cela aurait aussi introduit un élement d’'instabi- 
lité dans les estimations d’échantillon, surtout au moment 
ou les unites sont introduites dans |’échantillon ou en sont 
retirees par renouvellement. 


(ii) Il est déja arrive qu’on doive modifier la méthode de 
collecte des données ou la fréquence de cette collecte a 
cause du mauvais temps ou de l'inaccessibilité de ces 
secteurs. Ainsi, dans certains cas, les interviews n'ont 
lieu qu'une fois dans le cycle de 6 mois et les données 
sont reportees pour les autres mois. 


4.7.2 Plan de sondage pour les région éloignées 


On a examine individuellement chacune des RE situées le 
plus au Nord des provinces ou il y a des régions dites éloi- 
gnees. On a echantillonne par la méthode normale qui 
S'appliquait au type de secteur en cause les villes qui avaient 


Happy Valley), an urban stratum in Quebec and one 
rural Stratum in of each British Columbia, Alberta, 
Ontario and Quebec, were subjected to the regular 
sampling procedure for the corresponding type of area. 


EAs in the remote areas of most provinces tend to 
be very large geographic areas, with the population 
clustered in small settlements or "places". Enumera- 
tion of the population outside these places is extremely 
expensive and often not possible due to the 
remoteness. It was decided, therefore, to consider 
places as units of selection, with the precise boun- 
daries to be determined by the local interviewer at the 
time of selection. 


The units of selection for Remote Areas in all 
provinces except Ontario and Alberta consist of all 
places with a population of 25 or more. In Ontario and 
Alberta it was found that a frame using places would 
exclude too much population (almost 50% in these 
provinces) and there it was decided to use EAs or EA 
combinations with 20 or more occupied dwellings as 
the unit of selection. A similar problem existed in 
British Columbia; however, by including five very large 
EAs in the frame instead of only the places within 
them, the coverage of remote areas in this province 
exceeded 90°%. 


The resulting design reduces the difficulties of 
enumerating the very dispersed population while still 
ensuring more than 96% coverage in the Remote 
Areas, which is certainly adequate, given that the 
Remote Areas themselves represent only about 1% of 
the population of Canada. 


The measure of size for Remote Areas is the 
number of households (occupied dwellings from the 
1981 Census). Units (place or EA combination) are 
listed in descending order of size, and two, four or six 
units are selected in order to ensure an expected 
sample take of between 10 and 15 households from 
each selection. The larger units may be sub-divided 
into clusters by splitting EAs. Only two or more 
clusters are then selected, thus reducing the travel and 
maintenance costs of listing. 


4.7.3 Design of the institutions frame 


Certain EAs, consisting of one or more collective 
dwellings of substantial size, such as hospitals, military 
establishments (excluding permanent married quarters) 
and other institutions, were designated as Collective 
EAs in the 1981 Census. From all Collective EAs only 
those which contain military personnel or inmates 
(such as jails, hospitals, sanitoria etc.) were considered 
as part of the Institutions Frame in the special areas. 
Other collective EAs were deemed to contain regular 
population and were sampled with the regular SR and 


NSR sample. 
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des caractéristiques uniques en leur genre (comme Fort 
McMurray, Flin Flon, The Pas, Thompson et Happy Valley), 
une strate urbaine au Quebec et une strate rurale en 
Colombie-Britannique, en Alberta, en Ontario et au Québec. 


En general, les SD dans les régions éloignées de la 
plupart des provinces sont tres étendus et leur population est 
regroupee dans de petites agglomerations ou "localités". Le 
déenombrement de la population qui habite en dehors de ces 
localites est une opération qui coute extrémement cher et qui 
est souvent impossible a cause de |’éloignement de cette 
population. Il a done eté decide de consideérer ces localités 
comme des unites de selection dont les limites exactes 
seraient déterminées par l'intervieweur sur place, au moment 
ou elles seraient choisies. 


Les unites de sélection dans les régions éloignées de 
l'ensemble des provinces sauf |’Ontario et |’Alberta sont les 
localites dont la population est d’au moins 25 habitants. En 
Ontario et en Alberta, on a trouvé que, si on constituait une 
base dans laquelle figureraient seulement les localites, une 
trop forte proportion de la population serait exclue (pres de 
50%); on a donc décidé de prendre comme unites de selec- 
tion les SD ou des groupes de SD comptant 50 logements 
occupes ou plus. On a rencontré un probleme semblable en 
Colombie-Britannique, et on s’est rendu compte que, en 
incluant dans la base de sondage cinq tres grands SD au lieu 
d’y mettre seulement les localites, on obtenait un taux de 
couverture supérieur a 90% dans les regions eloignees de 
cette province. 


Le plan ainsi mis au point réduit la difficulte de dénombrer 
les populations tres dispersees tout en garantissant un taux de 
couverture de plus de 96% dans les regions eloignées, ce qui 
est certainement adequat compte tenu du fait qu'on ne trouve 
dans ces regions que 1% de la population du Canada. 


La taille des unites dans les regions eloignees est deéter- 
minee par le nombre de menages (logements occupes selon 
les resultats du recensement de 1981). Les unites (localités ou 
combinaisons de SD) sont enumérées par ordre décroissant 
de taille, et deux, quatre ou six unites sont prélevées pour 
assurer un. rendement prevu de |’échantillon de 10 a 15 me- 
nages par unite. Les grandes unités peuvent étre subdivisees 
en grappes en fractionnant les SD. On preleve deux grappes 
ou plus, ce qui réeduit les frais de déplacement et de mise a 
jour des listes. 


4.7.3 Conception de la base d’établissements 
institutionnels 


Au recensement de 1981, il avait éte décidé que certains 
SD, qui consistaient en un ou plusieurs logements collectifs 
de grande taille, comme les hdpitaux, les etablissements mili- 
taires (exception faite des logements familiaux sur les bases 
militaires) et d’autres etablissements institutionnels, porte- 
raient le nom de SD collectifs. De tous les SD collectifs, seuls 
ceux ou se trouvaient des militaires ou des pensionnaires 
d’établissement (p. ex. les prisons, les hdpitaux et les sana- 
toriums) ont eté considérés comme faisant partie de la base 
d’établissements institutionnels dans les secteurs spéciaux. 
Pour ce qui est des autres, on a juge qu’ils contenaient une 
population "normale" et quils devraient etre echantillonnés 
avec le reste de |’echantillon des secteurs AR et NAR. 


A provincial level list, in descending order of size, 
was created for the Institutions frame in all provinces 
except Prince Edward Island. In PEI, due to insufficient 
population, all collective EAs are treated as com- 
ponents of the regular SR and NSR frames. The size 
measure used was the labour force population 15 
years of age and older, which excludes all military, 
institutional and overseas population. Collective EAs 
with labour force population less than two (less than 
four in Ontario) were omitted from the sample frame of 
institutions, and as such stood no chance of selection. 
As is the case with remote areas, dropping the very 
small units was inconsequential in terms of the overall 
survey coverage. Two or more units per stratum were 
selected using PPS sampling, with an expected 
sample take of between 10 and 20 persons where 
possible. 


A summary of Special Areas is found in Appendix 
E: 
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On a dressé une liste par ordre décroissant de taille des 
SD collectifs dans la base d’établissements institutionnels 
pour chacune des provinces sauf I'lle-du-Prince-Edouard. A 
l'lle-du-Prince-Edouard, l’effectif de la population etant trop 
faible, on a traité tous les SD collectifs comme s'ils faisaient 
partie de la base normale des secteurs AR et NAR. Pour 
mesurer la taille des secteurs, on a pris la population active 
agee de 15 ans et plus moins le personnel militaire, les pen- 
sionnaires des établissements institutionnels et les personnes 
a |’étranger. Les SD collectifs dont la population active etait 
inférieure a 2 (ou a 4 en Ontario) ont ete exclus de la base de 
sondage des établissements institutionnels, de sorte qu’ils 
n'avaient aucune chance d’étre choisis. Comme dans le cas 
des régions éloignées, le fait de laisser tomber les toutes 
petites unites a eté sans consequence sur le taux de 
couverture globale de l’enquéte. On a prélevé deux unites ou 
plus par strate selon une probabilite proportionnelle a la taille 
en visant un rendement prévu de |’echantillon de 10 a 20 
personnes la ou c’était possible. 

Le traitement des secteurs speciaux est resume a 
annexe E. 


Chapter 5 


Sample Size Determination 


5.1 Introduction 


As part of the revision of the Labour Force Survey 
during the 1970s, the sample size was expanded from 
36,400 to 55,700 households per month. The principal 
objective of the sample expansion, which was carried 
out from 1976 to 1977, was to improve the reliability of 
provincial estimates. Prior to the sample size expan- 
sion, the Labour Force Survey (LFS) sample had been 
allocated with the objective of providing good national 
estimates, although sufficient oversampling of smaller 
provinces was done to permit the release of 
publishable data for all provinces. 


The strategy adopted in expanding the sample 
size was to keep the allocation of the initial 36,400 
households intact, and to allocate an additional 19,300 
households so as to meet or exceed a minimum level 
of data reliability in all provinces. Analysis showed that 
a target of an 8% or better coefficient of variation (CV) 
for monthly estimates of unemployed was attainable in 
all provinces except Prince Edward Island; this 
province would have required sampling rates in excess 
of what was felt tolerable in terms of response burden 
on the population. Allocation of the increased sample in 
this fashion led to decreases in the CVs for un- 
employed by 40% in Prince Edward Island and Saskat- 
chewan; 25% to 33% in Newfoundland, Manitoba, and 
Alberta; 10% in Nova Scotia, New Brunswick and 
British Columbia; and 5% in Quebec and Ontario. 


Within each province, separate sampling rates 
were adopted for NSR and SR areas, and deviations 
from these uniform sampling rates occurred only in a 
few exceptional cases. This was in keeping with the 
objective of maximizing the improvement in the 
reliability of provincial data. Nevertheless, as a by- 
product of the sample size increase it became possible 
to publish some subprovincial data monthly when the 
data release criterion of a CV of 33% or less was met. 
In fact, estimates of basic labour force characteristics 
(persons employed, unemployed and not in labour 
force: and corresponding rates) were published for 
CMAs, and for 53 individual or grouped Economic 
Regions, subject to supression of cells for which the 
rounded estimate of level was less than 4,000. Due to 
the uniform sampling rates within each province, the 
reliability of subprovincial data varied greatly depend- 
ing on the population of the subprovincial area In 


question. 


During the late 1970s and early 1980s _ the 
importance attached to subprovincial estimates among 
users of the survey data grew steadily. Important 
developments in this regard include the use of 


Chapitre 5 


Determination de la taille de l’echantillon 


5.1 Introduction 


Au moment de la révision de l’enquéte sur la population 
active dans les années 70, la taille de |’échantillon a ete portee 
de 36,400 a 55,700 ménages. Le principal objectif de cette 
operation, qui a éte effectuée entre 1976 et 1977, était de 
rendre les estimations provinciales plus fiables. Auparavant, la 
repartition de |’échantillon de |’EPA visait principalement la 
production de bonnes estimations a |’échelle nationale, 
quoique le surechantillonnage des petites provinces permettait 
de diffuser des données publiables sur toutes les provinces. 


La strategie adoptee lorsqu’on a élargi l’echantillon a ete 
de ne pas toucher a la repartition des 36,400 menages initiaux 
et de repartir les 19,300 ménages supplementaires de ma- 
niere a atteindre ou a dépasser un degre minimum de fiabilite 
des données dans |l’'ensemble des provinces. Il est ressorti 
des analyses qu'on pourrait ainsi obtenir un coefficient de 
variation (CV) de 8% ou moins pour les estimations relatives 
aux chomeurs dans toutes les provinces sauf |'lle-du-Prince- 
Edouard, ou il aurait fallu, pour atteindre ce but, utiliser des 
fractions de sondage depassant le seuil de tolerance de la 
population a |’égard du fardeau de reponse. Cette allocation 
du nouvel echantillon a entrainé une diminution du CV de 
l'ordre de 40% pour ce qui est des estimations du chomage a 
l'lle-du-Prince-Edouard et en Saskatchewan, de 25 a 33% 
pour les estimations concernant Terre-Neuve, le Manitoba et 
‘Alberta, de 10% pour celles se rapportant a la Nouvelle- 
Ecosse, au Nouveau-Brunswick et a la Colombie-Britannique 
et de 5% pour celles ayant trait au Quebec et a I’Ontario. 


Pour atteindre |l’objectif d’augmenter au maximum la 
fiabilite des donnees provinciales, on a adopte, dans chaque 
province, une fraction de sondage pour les secteurs AR et une 
autre pour les secteurs NAR, et on ne s'est ecarte de ce taux 
que dans quelques cas exceptionnels. Une consequence de 
l'élargissement de l'échantillon a neanmoins ete quiil est 
devenu possible de publier des donnees infraprovinciales sur 
une base mensuelle lorsque le critere selon lequel le CV 
devait étre de 33% ou moins pour la diffusion des donnees 
etait respecte. De fait, des estimations relatives aux caracteéris- 
tiques de base de la population active (nombre de personnes 
occupees, en chomage et inactives et taux correspondants) on 
ete publi¢ées pour les RMR et pour 53 regions economiques 
individuelles ou groupees, la seule contrainte etant la suppres- 
sion des cellules pour lesquelles les estimations arrondies 
étaient inférieures a 4000. Comme les fractions de sondage 
étaient uniformes a l'interieur d'une province, la fiabilite des 
données infraprovinciales variait beaucoup selon la population 
des regions en question. 


Pendant la fin des annees 70 et le debut des années 80, 
importance accordee aux estimations infraprovinciales de 
EPA par les utilisateurs des donnees de l'enquéte s'est 
accrue de facon continue. Ainsi, a Emploi et Immigration 


subprovincial LFS estimates by Employment and 
Immigration Canada in the administration of the 
Unemployment Insurance Program, and by the Depart- 
ment of Regional and Industrial Expansion in the 
calculation of their Development Index. In the former 
case, three-month moving averages of seasonally 
adjusted unemployment rates for individual or com- 
bined Economic Regions are used to establish 
regionally variable qualifying periods for weeks worked 
prior to eligibility for Unemployment Insurance bene- 
fits. In the latter case, three-year average estimates of 
employment and unemployment for individual or 
grouped census divisions are used in the calculation of 
the Development Index. This index determines the 
maximum level of funding assistance for which 
employers wishing to locate in an area may apply. 


Prior to the post-1981 Censal redesign of the LFS, 
a program evaluation of the survey was carried out that 
involved extensive consultation with users of the 
survey data. From the evaluation, and from user 
consultations conducted at the outset of the sample 
redesign, it became clear that the predominant interest 
vis-a-vis the quality of the survey estimates was in 
improved subprovincial data. Most users were of the 
opinion that provincial data quality was acceptable, and 
that gains in subprovincial data should not be achieved 
at the expense of reduced reliability for provincial data. 


5.2 Data Reliability Objectives 


Following consultations with the provinces and with 
key users among the federal government departments 
noted above, a set of data reliability objectives for the 
redesigned sample was established. These objectives 
in turn dictated the overall strategy for determining the 
size and allocation of the redesigned sample. 


The following data reliability objectives were set for the 
redesigned sample: 


(i) For Canada and each of the provinces, no 
reduction in the reliability for monthly estimates of 
level and estimates of month-to-month change for 
total employment and unemployment. 


(i) For 24 Census Metropolitan Areas as defined by 
the 1981 Census, monthly estimates for total un- 
employment with CVs of 20% or less. 


(ii) For 66 Subprovincial Economic Regions agreed to 
in consultation with the provinces, monthly esti- 
mates for total unemployment with CVs of 25% or 
less. 


(iv) For Census Agglomerations with populations of 
60,000 or more in Quebec and Ontario, and with 
populations of 25,000 or more in remaining 
provinces, three-month average estimates for total 
unemployment with CVs of 25% or less. 
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Canada, on a commence a utiliser ces estimations pour 
l'administration du Programme de |’assurance-chomage et a 
Industrie, Sciences et Technologie Canada, pour le calcul de 
indice de développement. A Emploi et Immigration, on se 
sert des moyennes mobiles sur trois mois des taux de cho- 
mage désaisonnalisés dans les régions economiques prises 
individuellement ou en groupe pour établir le nombre de 
semaines qu’il faut avoir travaillé, selon la région, pour étre 
admissible aux prestations d’assurance-chomage. A Industrie, 
Science et Technologie, on se sert des estimations moyennes 
sur trois ans de l'emploi et du chOmage dans des divisions du 
recensement prises individuellement ou en groupe pour 
calculer l'indice de développement. Celui-ci determine le mon- 
tant maximum d'aide financiére que peut demander un 
employeur désirant s’installer dans une region donnée. 


Avant le remaniement de |’EPA qui a suivi le recensement 
de 1981, une evaluation du programme de |l’enquéte a ete 
faite pour laquelle les utilisateurs des données ont ete con- 
sultés en grand nombre. Il est ressorti clairement de cette 
évaluation et des consultations aupres des utilisateurs 
effectuées au début du remaniement du plan de sondage que 
ce qui intéressait avant tout ces derniers en ce qui a trait a la 
qualité des estimations de l’enquéte, c’était qu’on améliore les 
données infraprovinciales. La plupart des utilisateurs étaient 
d’avis que la qualité des données provinciales etait acceptable 
et qu'il ne fallait pas réduire la fiabilite de ces dernieres pour 
ameliorer les données infraprovinciales. 


5.2 Objectifs de fiabiliteé des données 


A la suite des consultations mentionnées plus haut et 
menées aupres des provinces et des principaux ministeres 
fédéraux qui utilisent les données de |’EPA, on a dressé la 
liste des objectifs de fiabiliteé des données que le nouveau 
plan de sondage devait permettre d’atteindre, et ces objectifs 
ont a leur tour inspiré la stratégie globale adoptée pour 
determiner la taille et la repartition de |’échantillon. 


Les objectifs de fiabilite des données que le nouveau plan 
de sondage devait permettre d’atteindre sont les suivants : 


(i) Pour le Canada et les dix provinces, maintenir le degré de 
fiabilite des estimations mensuelles du niveau de l'emploi 
et du chomage et des estimations de la variation men- 
suelle de ce niveau. 


(ii 


a 


Pour 24 régions métropolitaines de recensement (RMR) 
telles que définies pour le recensement de 1981, produire 
des estimations mensuelles du chémage dont le coef- 
ficient de variation (CV) ne dépasserait pas 20%. 


(iil) Pour 66 régions économiques infraprovinciales choisies 
avec l'accord des provinces, produire des estimations 
mensuelles du chomage dont le CV ne dépasserait pas 
25%. 


(iv) Pour les agglomérations de recensement de 60,000 habi- 
tants ou plus du Québec et de l'Ontario et de 25,000 
habitants ou plus des autres provinces, produire des 
estimations trimestrielles moyennes du chémage dont le 
CV ne dépasserait pas 25%. 


Departures from the overall strategy were made 
where necessary to accommodate specific user 
requirements. As an example of this, the province of 
Quebec expressed the need for monthly estimates for 
the CA of Sherbrooke, which according to the general 
strategy would have qualified only for three-month 
average estimates. 


5.3 Steps in Allocating the Sample 


To meet the data reliability objectives for improved 
Subprovincial data under the redesigned sample, 
departure from the uniform nature of the old allocation 
was necessary. The allocation of the redesigned 
sample was carried out as described below. 


5.3.1 Optimum relative sampling rates 

As a preliminary step, the optimal relative 
sampling rates for NSR and SR areas under a 
proportional allocation scheme as it existed for the old 
design was determined using up-to-date data. In order 
to make the desired improvement in sub-provincial 
data, different sampling rates were needed from one 
sub-provincial area to the next. However, it was felt 
that, where possible, the optimal relative rates should 
serve as the basis for allocating the sample within sub- 
provincial areas. 


A simple cost and variance model introduced by 
Fellegi, Gray and Platek (1967) during the 1962 
redesign of the LFS was used. Under the model the 
total cost (C) and variance (V) are respectively given 
by 


CP; OP, 
oh 
W, W, 


and 


V = W,P,o; + W,P,03 


where 1. and 2 denote area type (1 for SR, and 2 
for NSR), Cand o? are unit (i.e., per person) cost and 
unit variance, P denotes population and 1/W is the 


sampling rate. 


Fellegi et al. showed that to minimize costs while 
variances are fixed, the ratio of sampling rates Is: 


Parameters for the model were estimated as 
follows: 


(i) Unit costs: Historical per dwelling costs by type of 
area were available. These were decreased by 
10% for NSR areas to take into account the 
estimated effect of the shift from personal to 
telephone interviewing of households during their 
second through sixth months In the sample. The 
population was based on the 1981 Census. 
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On a fait des exceptions pour répondre a certaines 
exigences précises des utilisateurs. Ainsi, on a accede a la 
demande de la province de Québec, dont les représentants 
ont dit avoir besoin d’estimations mensuelles relativement a 
l'‘agglomeration de recensement de Sherbrooke, pour laquelle 
on ne devait produire en principe que des estimations 
trimestrielles moyennes. 


5.3 Repartition de l’echantillon 


Pour atteindre les objectifs de fiabiliteé des données et 
ameliorer les données infraprovinciales au moyen du nouveau 
plan .de sondage, il a fallu laisser tomber la répartition 
uniforme de |’échantillon qui avait caractérise l|’ancien plan. 
Le mode de repartition de |’échantillon prelevé selon le 
nouveau plan de sondage est decrit ci-apres. 

5.3.1 Fractions de sondage relatives optimales 

L’étape préliminaire a la répartition a consiste a deéter- 
miner, au moyen de données a jour, les fractions de sondage 
relatives optimales pour les secteurs NAR et AR selon le 
mode de repartition proportionnelle employe dans |’ancien 
plan de sondage. Alors que pour apporter les ameliorations 
voulues aux données infraprovinciales il aurait fallu appliquer 
des fractions de sondage differentes a chacune des regions 
infraprovinciales, on a estime qu’on devrait, autant que pos- 
sible, se servir des fractions de sondage relatives optimales 
pour repartir |’echantillon entre ces regions. 


On s'est servi d'un modéle simple de couts et de 
variances propose par Fellegi, Gray et Platek (1967) pendant 
le remaniement de 1962. Selon ce modele, le cout total (C) et 
la variance (V) sont obtenus respectivement par les formules 


CP, C,P, 
C=. 


W, W, 


et 


V = W Pio? + W,P,03 


ou 1 et 2 indiquent le genre de secteur (1 pour AR et 2 
pour NAR), C et 0 sont le cout par unite (c.-a-d. par personne) 
et la variance par unite, P est la population et 1/W est la 
fraction de sondage. 


Fellegi et ses collaborateurs ont montre que, pour reduire 
les couts au Maximum lorsque les variances sont fixes, le ratio 
des fractions de sondage est 


On a estime les parametres du modele de la maniere 
suivante : 


(i) Couts par unité : On connaissait les anciens couts par 
logement selon le genre de secteur. On a diminue de 
10% les couts dans les secteurs NAR, pourcentage 
estime de la difference engendree par le fait que les inter- 
views se feraient dorenavant par telephone du deuxieme 
au sixieme mois ou les menages seraient dans |’echan- 
tillon. Les chiffres de population etaient bases sur les 
resultats du recensement de 1981. 


(ii) Unit variances: Optimization was carried out for the 
characteristic unemployed, for which variances 
were given by: 


where j = 1, 2 (area type), F = design effect for 
unemployed and u = persons unemployed. 


Average design effects by type of area were 
determined from the old design and adjusted to reflect 
anticipated reductions due to the structural improve- 
ments in the redesigned sample. The factors for design 
effect reductions were obtained from studies carried 
out during the preliminary research phase of the 
sample redesign. 


Persons unemployed, u, was derived by mul- 
tiplying the average unemployment to population ratio 
for the period 1980-1982 by the 1981 Census popula- 
tion. The 1980-82 period was used, since average 
unemployment rates for the period conformed closely 
to medium term forecasts for the 1980s and early 
1990s then being made by the Department of Finance 
and others. It included two years of comparatively low 
unemployment rates (7.5% in 1980 and 1981), and one 
year of higher unemployment (11% in 1982). 


This analysis indicated that an allocation very 
close to proportional allocation of the sample to NSR 
and SR areas was optimal. It also indicated that the 
NSR areas, as suspected, were oversampled under the 
old design (see Columns (1)-(3), Table 1). 


Table 1 


Percent of Sample in Self Representing Areas 
within Provinces 
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(ii) Variances par unité : On a effectué l'optimisation en 
fonction de la caractéristique "Chodmeurs" pour laquelle 
les variances étaient definies : 


ou j = 1, 2 (genre de secteur), F = effet du plan pour les 
chomeurs et u = nombre de chomeurs. 


On a déterminé les effets moyens du plan selon le genre 
de secteur d’apres l’ancien plan de sondage et on les a 
corrigeés a la baisse pour tenir compte des consequences 
qu'auraient les améliorations structurelles apportees dans le 
nouveau plan. Des études effectuees pendant la phase de 
recherche qui a precede le remaniement du plan de sondage 
ont permis de connaitre les facteurs susceptibles de réduire 
les effets du plan. 


On a obtenu u, le nombre de chomeurs, en multipliant le 
ratio moyen du nombre de chomeurs a la population pendant 
la période 1980-1982 par la population au recensement de 
1981. On a pris la période 1980-1982 parce que les taux de 
chémage moyens pour cette période sont tres proches des 
previsions a moyen terme effectue€es pour les années 80 et le 
début des annees 90 par certains organismes, dont le minis- 
tere des Finances. On y a enregistré un taux de chomage 
relativement faible pendant deux ans (7.5% en 1980 et en 
1981) et un taux elevé pendant un an (11% en 1982). 


Selon les resultats de cette analyse, la_ repartition 
optimale etait une répartition tres proche de la repartition 
proportionnelle de |’échantillon entre les secteurs NAR et les 
secteurs AR, et les secteurs NAR étaient, comme on s’en 
doutait, suréchantillonnes dans l’ancien plan de sondage (voir 
les colonnes 1-3 du tableau 1). 


Tableau 1 


Pourcentage de l’echantillon dans les secteurs AR, par 
province 


Old Proportional Optimum Redesigned 
Sample Allocation Allocation Sample 

Province 
Ancien Repartition Répartition Nouveau 
plan proportionnelle optimale plan 
Newfoundland — Terre-Neuve 41.8 SilE3) 42.6 44.6 
Prince Edward Island -— lle-du-Prince-Edouard 26.6 32.8 32.8 28.9 
Nova Scotia - Nouvelle-Ecosse S73 57.4 58.8 51.9 
New Brunswick — Nouveau-Brunswick 49.5 62:5 47.4 53.6 
Quebec 56.8 74.8 FAO 68.9 
Ontario 62.5 79.1 78.8 75.0 
Manitoba 54.1 71.0 76.4 56.4 
Saskatchewan 44.7 Ses 62.1 56.8 
Alberta 60.0 68.6 72.6 62.3 
British Columbia - Colombie-Britannique 58.0 78.0 74.6 69.7 


Canada 


53.2 67.1 67.4 62.3 


5.3.2 Adjustments to the optimum allocation 


To meet the reliability objectives for the smaller 
subprovincial areas as noted in section 5.2 and to 
realize the saving resulting from the structural impro- 
vements in the design, the following adjustments were 
made to the optimal allocation. 


(i) Fix Sample Sizes for Smaller Subprovincial 
Regions 


The sample sizes were adjusted for the smaller 
ERs and CMAs that would not have met targeted data 
reliability levels under an optimal/proportional allocation 
by type of area. To help this process, the data 
reliability targets were translated into standards for 
minimally acceptable sample sizes of 300 households 
per month for monthly estimates for CMAs and 
Economic Regions. Similarly, the standard adopted for 
three-month estimates for CAs was a sample size of 
120 households or more per month. In contrast, under 
the old design, monthly data for smaller CMAs were 
published based on sample sizes of 130 households 
per month. 


(ii) Allocation to Remaining Areas 


The old provincial sample sizes, adjusted for 
smaller regions, as noted in (i) above, were allocated to 
various subprovincial regions in each province using 
the optimum relative sampling rates as determined in 
SSM, 


(iii) Sample Reduction due to Structural 
Improvements 


Studies undertaken indicated that the structural 
improvements resulting from more efficient methods 
and procedures developed for the redesign would lead 
to a significant increase in the reliability of data at 
various levels of aggregation. The choice, therefore, 
was either to retain the increased data reliability or to 
translate these gains into savings. A decision was 
made to reduce the provincial sample sizes to the 
point where the reliability of provincial level estimates 
was the same as that under the old design. The 
decreases ranged from 5% to 9% depending on the 
province, and they were generally confined to the 
largest CMAs and ERs in an effort to achieve more 
uniformity in the reliability of subprovincial data. 


This yielded a sample size for the redesigned LFS 
of 51,700 households, a 7% reduction over the sample 
size under the old design. It excludes a sr gi ae 

f 1.300 dwellings in Alberta. This special sample Is 
rot part of the sisal base, and is funded by Alberta 
in order to obtain monthly estimates for medium sized 
cities in the province and annual estimates for Census 


Divisions. 
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5.3.2 Modifications apportées a la répartition optimale 


Pour atteindre les objectifs de fiabilite dans les petites 
régions infraprovinciales dont il a été question a la section 5.2 
et realiser les economies qui devraient découler des amelio- 
rations structurelles apportees au plan, il a fallu modifier la 
repartition optimale de la maniére suivante. 


(\) Taille fixe des echantillons dans les petites regions 
infraprovinciales 


On a modifié la taille des echantillons dans les petites RE 
et RMR pour lesquelles les données n’auraient pas atteint le 
niveau de qualité voulu si on avait fait une repartition opti- 
male/proportionnelle selon le genre de région. Pour faciliter ce 
processus, on a etabli des normes en matiere de taille mini- 
mum de |’échantillon devant permettre d’atteindre |l’objectif de 
fiabilite, en l’occurrence : 300 ménages par mois pour les 
estimations mensuelles relatives aux RMR et aux RE et 120 
meénages ou plus par mois pour les estimations trimestrielles 
relatives aux agglomerations de recensement. Il convient de 
signaler a titre de comparaison que, selon |’ancien plan de 
sondage, les donnees mensuelles publiees sur les petites 
RMR étaient fondées sur un échantillon de 130 menages par 
mois. 


(i) Reépartition dans les regions restantes 


On a reparti |’échantillon entre les régions infraprovin- 
ciales de chaque province en prenant les memes. tailles 
d’echantillon que dans l’ancien plan, en apportant les modi- 
fications indiquees au paragraphe precedent pour les petites 
regions et en appliquant les fractions de sondage relatives 
optimales determinees selon la methode indiqueée a la section 
5.55). 


(iii) Reduction de I’echantillon en raison des 
ameéliorations structurelles 


Selon les résultats d’etudes menees a cet egard, les ame- 
liorations structurelles qui deécouleraient d'une plus grande 
efficacite des methodes elaborees dans le cadre du rema- 
niement du plan de sondage entraineraient une augmentation 
marquee de 1a fiabilite des donnees a divers degres d'agre- 
gation. Il s’agissait alors de choisir entre conserver cet 
avantage ou le remplacer par des economies d'argent. On a 
decide de reduire la taille des echantillons provinciaux de 
maniere a ce que le degre de fiabilite des estimations 
provinciales soit le meme qu’avec l’ancien plan de sondage. 
Cette diminution a varie de 5 a 9% selon la province, et on l’a 
generalement effectuee dans les tres grandes RMR et RE afin 
que la fiabilite des donnees infraprovinciales soit uniforme. 


L’echantillon ainsi obtenu etait de 51,700 menages, soit 
une baisse de 7% par rapport a l’ancien plan de sondage. Ce 
chiffre ne tient pas compte d'un echantillon special de 1,300 
menages en Alberta. (Cet eéchantillon special n'est pas 
preleve dans la base nationale, et c’est la province de |'Alberta 
qui le finance dans le but de disposer d’estimations men- 
suelles pour les villes de taille moyenne et d’estimations 
annuelles pour les divisions de recensement.) 


(iv) Post-Redesign Decrease in Sample Size 


Following the introduction of the redesigned 
sample in 1985, the sample size continued to be 
51,700 until June 1986. At this time the sample size 
was reduced by 10% as a cost saving measure. The 
sample size decreases were concentrated in larger 
CMAs within each province, with 33% cuts in Montreal, 
Toronto, and Vancouver; 20%-25% in St.John’s, 
Halifax, Saint John, Ottawa-Hull, Winnipeg, Regina, 
Saskatoon, Calgary, and Edmonton; and 10% in 
Quebec, Hamilton, and Victoria. Additionally, cuts of 
20% occurred in certain Census Agglomeration areas. 


This sample size reduction was achieved initially 
by means of sample size stabilization, whereby a 
portion of the selected dwellings was dropped prior to 
the interview. Later, changes were made in the basic 
stratum sampling rates to directly select the reduced 
size of the sample. 


Sample sizes for the post-1971 Censal design 
(both before and after the 1976/77 sample size 
increase), and the post-1981 Censal design (initial, and 
post-1986 decrease) are given in Table 2. 


Table 2 


LFS Sample Sizes by Province 
Old and New Designs 


52 


(iv) Diminution de la taille de ’echantillon subsequente 
au remaniement 


Apres introduction de I'échantillon preleve selon le 
nouveau plan en 1985, on en a maintenu la taille a 51,700 
ménages jusqu’en juin 1986. A ce moment-la, on l’'a reduit de 
10% pour faire baisser les couts. Ce sont les échantillons des 
grandes RMR dans chaque province qui ont subi une 
diminution : ceux de Montréal, de Toronto et de Vancouver, de 
33%, ceux de St. John’s, de Halifax, de Saint-Jean, d’Ottawa- 
Hull, de Winnipeg, de Regina, de Saskatoon, de Calgary et 
d'Edmonton, de 20 a 25% et ceux de Québec, de Hamilton et 
de Victoria, de 10%. L’échantillon de certaines agglomerations 
de recensement a également éte réduit de 20%. 


Au départ, on a diminué la taille de l’echantillon en 
stabilisant celle-ci, c’est-a-dire en laissant tomber une partie 
des logements choisis avant l'interview. Par la suite, on a 
modifié les fractions de sondage de base de la strate afin de 
déterminer directement la taille réduite de |’echantillon. 


Le tableau 2 donne la taille des echantillons dans le plan 
remanié apres le recensement de 1971 (avant et apres 
|'élargissement de |'échantillon survenu en 1976-1977) et dans 
le plan remanié apres le recensement de 1981 (initiale et 
subséquente a la reduction de 1986). 


Tableau 2 


Taille de l’échantillon de l’EPA selon la province 
Ancien et nouveau plans 


Old LFS Design 


Ancien plan de !EPA 


New LFS Design 


Nouveau plan de EPA 


Province Pre-increase Post-increase Initial Post-decrease Post-increase 

(1972-1976) (1976-1984) (1985-May 1986) (June 1986) (April 1990) 

Avant Apres Taille Apres la Apres 

l'elargissement l'elargissement initiale reduction l'elargissement 

(1972-1976) (1976-1984) (1985-Mai 1986) (Juin 1986) (Avril 1990) 

Newfoundland — Terre-Neuve 1,815 3,091 2,789 2,628 2,970 
Prince Edward Island —- lle-du- 

Prince-Edouard 479 1,436 1,421 1,421 1,421 
Nova Scotia - Nouvelle-Ecosse 3,262 4,234 3,833 3,508 4,409 
New Brunswick — Nouveau- 

Brunswick 2,539 4,260 3,854 3,497 3,843 
Quebec 7,308 oHOLONS) 8,044 7,074 11,956 
Ontario 9,544 10,903 10,246 9,176 18,045 
Manitoba 1,860 4,489 4,139 3,676 4,297 
Saskatchewan 1,997 5,989 5,453 4,927 4,963 
Alberta 3,404 6,806 6,316 5,605 5,625 
Britisn Columbia - Colombie- 

Britannique 4,197 5,968 5,574 4,949 5,470 
Canada 36,405 55,731 51,669 46,461 62,999 


5.3.3 Impact of sample size reductions 


, As a result of improvements in the sample design 
in NSR and SR areas, and the improved allocation of 
the sample to the two types of area, it was possible to 
achieve substantial data reliability gains for sub- 
provincial data and comparable levels of data reliability 
at the province level, with a sample size 7% smaller 
than that prior to the redesign. 


For the 13 of the 66 Economic Regions, 6 of the 
24 CMAs, and 27 of the 42 non-CMA cities where 
sample size increases were required, an average 28% 
reduction in the CVs for the unemployed was obtained. 
In addition, for the 30 ERs with old CVs in the range of 
15%-25%, there was an average 12% reduction in the 
CVs. 


In addition to improvements in the quality of 
subprovincial data, the amount of subprovincial data 
was significantly increased under the redesigned 
sample. The number of ERs for which data are 
published increased from 53 to 67. Also, the number 
of CMAs for which data are published was increased 
from 23 to 24 as the result of the addition of one new 
CMA in the 1981 Census. Finally, the capability to 
produce three-month average estimates for the 42 CAs 
was added. 


Table 3 


Targeted Coefficients of Variation for Unemployed 
by Province, Old and New Designs 
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5.3.3 Consequences de la réduction de la taille de 
’'echantillon 


Grace aux améliorations apportées au plan de sondage 
des secteurs AR et NAR et a la repartition de |’échantillon 
entre ces deux types de secteurs, il a été possible d’aug- 
menter de facon marquee la fiabilite des données infrapro- 
vinciales et de maintenir a un niveau comparable la fiabilite 
des données provinciales tout en ayant un echantillon dont la 
taille etait inferieure de 7% a celle de |’echantillon avant le 
remaniement. 


Pour 13 des 66 régions economiques, 6 des 24 RMR et 
27 des 42 villes autres que les RMR ou il a fallu elargir 
l’echantillon, on a obtenu une diminution moyenne de 28% du 
CV des estimations relatives au chomage. En outre, on a 
reussi a faire baisser de 12% environ le CV pour les 30 RE 
ou celui-ci se situait auparavant entre 15 et 25%. 


Non seulement on a amelioré la qualite des données 
infraprovinciales produites au moyen du nouveau pian, mais 
on a aussi nettement augmente leur quantite. Le nombre de 
RE pour lesquelles des donnees sont publiees est passe de 
53 a 67, et le nombre de RMR, de 23 a 24, du fait qu’une 
nouvelle RMR a été ajouteée au recensement de 1981. Enfin, 
on s'est donne les moyens de produire des estimations 
trimestrielles moyennes pour 42 agglomerations de recense- 
ment. 


Tableau 3 


Coefficients de variation viseés pour les estimations 
relatives au chomage, selon la province, Ancien et 
nouveau plans 


Old Design New Design 
Ancien plan Nouveau plan 
Province Households Initial (51,669 Post-decrease 
(557340) nouseholds) (46,461 households) 
Menages Taille initiale Apres la reduction 
(55,731) (51,669 menages) (46,461 menages) 
Newfoundland — Terre-Neuve fe 7.2 75 
Prince Edward Island — Ile-du-Prince-Edouard 9.7 8.9 8.9 
Nova Scotia — Nouvelle-Ecosse 5.5 5.4 5.7 
New Brunswick — Nouveau-Brunswick 6.3 6.4 6.6 
Quebec Ha) 3.8 45 
; 4. 
Ontario 3.7 3 : : : 
Manitoba ae Ne ve 
Saskatchewan 7.2 7. 
Alberta 6.2 6.2 6.7 
British Columbia - Colombie-Britannique 5.3 5.4 5.9 


Canada 


iS. 1:9 251 


Given the concentration of the post-redesign 
sample size decrease in the larger CMAs, the data 
reliability gains for the smaller sub-provincial regions 
were left intact. However, in addition to the reduced 
data reliability for the CMAs in question, the sample 
size decrease resulted in a 10% increase in the CV for 
the national estimate of unemployed, and_ similar 
reductions in data reliability for several of the provinces 
(see Table 3). 


5.3.4 Sample size increase in 1989-90 


During the period from November 1989 to April 
1990, the LFS sample size was increased to provide 
improved estimates for Unemployment Insurance 
Commission regions. The increased sample was 
allocated only to regions which required it to yield 
estimates of unemployment with a coefficient of 
variation not exceeding 15% for quarterly estimates. 
Regions which already met this requirement were not 
changed. As a result, the bulk of the new sample fell in 
Ontario and Quebec. The last column of Table 2 
presents the provincial sample sizes after the increase. 
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Comme la réduction de |’échantillon a touche principa- 
lement les grandes RMR, les gains realises sur le plan de la 
fiabilite des données pour les petites régions infraprovinciales 
sont demeurés intacts. Toutefois, cette reduction a entrainé 
non seulement une baisse de la fiabilite des donnees pour les 
RMR en question, mais aussi, comme on peut le voir au 
tableau 3, une augmentation de 10% du CV des estimations 
nationales relatives au chomage et une baisse semblable de la 
fiabilite des données pour plusieurs provinces. 


5.3.4 Augmentation de la taille de l’echantillon en 
1989-1990 


Pour la période allant de novembre 1989 a avril 1990, la 
taille de I’échantillon de IEPA a éte augmentee afin d’ame- 
liorer les estimations pour les regions de la Commission d’as- 
surance chémage. L’augmentation de la taille de |’échantillon 
a ete allouée seulement aux régions qui le nécessitaient afin 
d'obtenir des estimations du chomage ayant un coefficient de 
variation n'excédant pas 15% pour les estimations trimes- 
trielles. Ainsi, les regions qui respectaient deja ce critere n'ont 
pas ete modifiés. La majorite des nouvelles unites sont 
situees en Ontario et au Québec. La taille des éehantillons 
pour les provinces (apres |l’augmentation) est presentée a la 
derniere colonne du tableau 2. 


Chapter 6 


Sample Rotation 


6.1. Introduction 


Rotation of the LFS sample involves complete or 
partial replacement of sampling units conducted in 
such a way that the sample for each month is a 
probability sample. Rotation of sampling units occurs 
at each stage of the multi-stage sample design. The 
ultimate unit of selection, the household, is replaced 
every six months, whereas successively higher staged 
units remain in the sample for longer periods of time. 
The determination of six months as the period for 
rotation of households is a trade off between the cost 
of rotation and the increase in non-response that might 
occur if respondents were asked to remain in the 
survey for a longer period of time. 


To ensure uniform interviewer workloads and to 
minimize the effect of any bias due to the number of 
months a household has been in the survey, a rotation 
scheme was adopted whereby one sixth of the 
households rotate each month. This is achieved by 
associating with each PSU-Group-Cluster a rotation 
number between one and six. This number determines 
the months in which the rotation of households takes 
place (rotation number one implies the rotation of 
households in January and July; two in February and 
August; etc.). Described in the following sections are 
the methods by which rotation of units takes place, the 
operational steps involved in sample rotation, and the 
methods by which rotation numbers are assigned. 


6.2 Method of Rotation 


In the LFS design, sampling units at each stage of 
selection rotate. Although dwellings remain in the 
sample for only six months, units at successively 
higher stages of sampling remain in the sample for 
longer periods of time before rotating. 


Rotation of the sample is relatively straightforward 
for the sampling methods followed in the design 
(randomized PPS systematic in the NSR area, random 
group method in the SRUs, and PPS systematic in 
apartment and special areas). 


Chapitre 6 


Renouvellement de |’echantillon 


6.1. Introduction 


Le renouvellement de |’échantillon de |'EPA consiste a 
remplacer une partie ou la totalite des unites d’échantil- 
lonnage, et il est effectué de maniére qu’on ait chaque mois 
un echantillon probabiliste. On procéde au renouvellement des 
unites a chaque eétape du processus d’échantillonnage a 
plusieurs degrés. La derniere unite de selection, le menage, 
est remplaceée tous les six mois, tandis que les unités sélec- 
tionneées aux degrés antérieurs demeurent dans |’echantillon 
pendant une periode plus longue, les unites du premier degre 
y restant plus longtemps que celles du deuxieme, et ainsi de 
suite. On a fixé a six mois la période de renouvellement de 
l’echantillon des meénages, car cette durée permettait d’attein- 
dre un équilibre entre l'augmentation des couts a laquelle on 
assisterait si le renouvellement etait plus frequent et l’accrois- 
sement du taux de non-reponse qui pourrait se produire si l’on 
demandait aux menages de participer a |'enquéte plus 
longtemps. 


Pour assurer aux intervieweurs une charge de travail 
uniforme et reduire au maximum le biais associé au nombre 
de mois pendant lesquels un menage a ete interrogé, on a 
adopte un mode de renouvellement selon lequel un sixieme 
de |'echantillon est remplace chaque mois. Pour y arriver, on 
attribue a chaque UPE/groupe/grappe un numero de renou- 
vellement entre un et six, qui determine quel mois le menage 
sera remplace (tous les méenages portant le numero de 
renouvellement un sont remplaces en janvier ou en juillet, 
ceux portant le numéro deux, en fevrier ou en aout, etc.). Les 
sections qui suivent decrivent la methode de renouvellement 
des unités d’échantillonnage, le processus de renouvellement 
de l'echantillon et le mode d’attribution des numeros de 
renouvellement. 


6.2 Méthode de renouvellement 


Selon le plan de I'EPA, les unites sont renouvelees a 
chaque degre d’éechantillonnage. Alors que les logements ne 
restent dans |’echantillon que pendant six mois, plus on 
remonte vers le premier degre d’echantillonnage, plus les 
unites demeurent dans |’echantillon longtemps. 


Le renouvellement de |’échantillon est une operation rela- 
tivement simple compte tenu des methodes d’echantillonnage 
adoptees (methode d’echantillonnage systematique avec 
classement aleéatoire et ppt pour les secteurs NAR, methode 
des groupes aléatoires pour les UAR et methode d’echan- 
tillonnage systematique pour les immeubles d’appartements 
et les secteurs speciaux). 


In the two-stage SR design, rotation occurs as 
follows. Under the selection method, clusters within a 
stratum are randomly ordered and partitioned into 
groups. For the initially selected cluster within each 
random group, two numbers between one and the 
cluster inverse sampling ratio (ISR) are generated at 
random. The first determines a random start for 
systematic selection of dwellings within the cluster. 
The second determines the number of systematic 
samples of dwellings to be drawn from the cluster, that 
is, the number of six-month periods for which the 
cluster will remain in the sample. 


Prior to each occasion for selecting a new sample 
of dwellings, the random start for the cluster is 
incremented by one, until the incremented value would 
exceed the cluster ISR, at which time the start reverts 
to 1. After the randomly determined number of 
sampling occasions, cluster rotation occurs. 


The random retention period for initially selected 
clusters is necessary to ensure that initial probabilities 
of selection of units are preserved over time. If, for 
example, initially selected units were retained until 
exhausted (that is, until all systematic samples of 
dwellings were used), this would eventually result in a 
biased sample with overrepresentation of larger units. 
Cluster rotation is carried out by proceeding to the next 
cluster on the randomized list of clusters in the group. 
Replacements for initially selected units, and subse- 
quent replacements, all remain in the sample until 
exhausted. As with initially selected clusters, the selec- 
tion of dwellings is governed by a random start 
between 1 and the ISR which advances at each 
sampling occasion. 


In NSR areas, rotation of dwellings and clusters 
proceeds similar to that in SR areas, and additionally 
there is rotation of rural groups. The urban groups of 
the PSUs, since they are selected with certainty, do 
not rotate but remain in the sample as long as the PSU 
does. Rotation of rural groups and PSUs is similar to 
rotation of clusters, except that, for both units, mini- 
mum periods of time are established before rotation 
takes place, due to the costs associated with their 
rotation. For rural groups this period corresponds to 
the minimum isr of all the rural groups within the PSU, 
whereas for PSUs the minimum period is staggered 
across each province; this guards against any 
discontinuity in the time series due to rotating many 
units at once. Because the rotation of initially selected 
units is delayed in this fashion, the rotation of replace- 
ment units is correspondingly advanced to preserve 
the correct probabilities of selection over time. 
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Le renouvellement se fait de la maniere suivante pour les 
secteurs AR, ou I’échantillonnage est a deux degrés. Selon la 
méthode de sélection, les grappes d'une strate sont classees 
au hasard et réparties en groupes. Pour la premiere grappe 
choisie dans chaque groupe aléatoire, on genere au hasard 
deux nombres entre 1 et la fraction de sondage inverse (fsi) 
de la grappe. Le premier détermine l'origine aléatoire pour 
l'échantillonnage systématique des logements dans la grappe. 
Le second détermine le nombre d’échantillons systematiques 
de logements a prélever dans la grappe, c’est-a-dire le 
nombre de périodes de six mois (cycles) pendant lesquelles la 
grappe fera partie de |’echantillon. 


Avant chaque prélevement d’un nouvel echantillon de 
logements, on ajoute 1 a lorigine aleatoire de la grappe, 
jusqu’a ce que la valeur obtenue dépasse la fsi de la grappe; 
a ce moment-la, |'origine redevient 1. Une fois qu’on a atteint 
le nombre de prélevements de |’échantillon qui a eté choisi au 
hasard, on procéde au remplacement de la grappe. 


ll est nécessaire d’attribuer a chaque premiere grappe 
choisie un nombre aléatoire de cycles pendant lesquels elle 
restera dans |’échantillon pour maintenir la probabilite initiale 
de sélection des unites. Si, par exemple, on gardait les pre- 
miéres unités choisies jusqu’a epuisement de |'échantillon, 
c'est-a-dire jusqu’a ce que tous les échantillons systematiques 
de logements aient ete preleves, |’echantillon finirait par 
devenir biaisé, car les grandes unites y seraient sur- 
representées. On procede au renouvellement d’une grappe en 
passant a la grappe suivante dans la liste randomisée de 
grappes par groupe. Les unites qui remplacent les premieres 
unites choisies et toutes les unites remplacantes qui suivent 
restent dans l’échantillon jusqu’a ce qu’on ait épuise celui-ci. 
Comme dans le cas des premieres grappes choisies, le choix 
des logements est déterminé par une origine aleatoire entre 
un et la fsi, a laquelle on ajoute 1 a chaque prélevement de 
l’echantillon. 


Pour les secteurs NAR, on procede au renouvellement 
des logements et des grappes comme pour les secteurs AR, 
mais i| y a en plus le renouvellement des groupes ruraux. 
Comme les groupes urbains des UPE sont choisis avec une 
probabilite egale a 1, ils ne sont pas remplacés et restent 
dans |’échantillon aussi longtemps que |’UPE. Le renou- 
vellement des groupes ruraux et des UPE est semblable a 
celui des grappes, sauf que, dans les deux cas, la période 
minimum de conservation dans |’échantillon est établie avant 
que le renouvellement ait lieu, a cause des couts associés a 
ce dernier. Pour les groupes ruraux, cette période correspond 
a la fsi minimum de tous les groupes ruraux dans |’'UPE, 
tandis que, pour les UPE, elle est échelonnée a l'intérieur de 
chaque province, pour éviter la discontinuité dans les séries 
chronologiques qui résulterait du renouvellement d'un trop 
grand nombre d’unites a la fois. Le renouvellement des 
premieres unités étant ainsi retardé, le renouvellement des 
unites de remplacement est avancé en conséquence pour 
maintenir les bonnes probabilités de sélection. 


6.3 Operational Steps Involved in Sample 
Rotation 


Rotation of the sample is automated within a 
system known as the Sample Design System, which 
identifies the units that are rotating in and out of the 
sample for each survey. These rotating units require 
manual processing by Sample Control staff, who 
identify the geographical area represented, and form 
lower stage sampling units where applicable. 


Each of the cluster selection computer programs 
create rotation records, which describe the pattern of 
rotation after each initial cluster selection. These 
rotation records describe the sequence of advancing 
starts within clusters and the sequence of between 
cluster rotations corresponding to each selection within 
a group. Each record lasts the life of the group, up to a 
maximum of 40 random starts. The collection of these 
records constitutes the master rotation file, which is 
used to automatically rotate the sample. The master 
rotation file is changed as rotation patterns are updated 
(as in the open-ended apartment frame), and as old 
records become exhausted and are replaced by new 
ones. 


The way in which the rotation of households is 
accomplished is as follows. Seven months before a 
particular survey date, a file is created that contains 
design information on all clusters newly rotating into 
the sample for that survey date. This file is used to 
initiate the database for listing purposes, and to identify 
for Sample Control the clusters for which cluster 
diagrams (FO1s) are required. The FO1s are sent to 
the Regional Offices (ROs) to be received coincident 
with the Sample Status Report, which is generated 22 
to 23 weeks before the date of introduction and 
identifies all the new clusters requiring listing. The 
process of listing requires that a separate list line be 
completed on the Cluster List (F02) for each dwelling 
in the cluster. 


The lists are entered on minicomputers in the ROs 
and are transmitted to the central database. Prior to 
the survey date a file (which is created from the 
rotation files by the Sample Design System) is fed into 
the database: this file specifies the random start and 
inverse sampling ratio to be applied to each cluster in 
the sample. Thereafter, selection of households iS 
accomplished by a systematic sample of the lists, and 
household dockets are printed in the RO for each 
selected household. Households remain in the sample 
for six months (or less if they are introduced in a 
month other than that associated with their rotation 
number, as when phasing in new parts of the sample). 
After the six months another set of random starts Is 
reserved on the database, thereby resulting in selec- 
tion of new households. 


Dif 


6.3 Processus de renouvellement de |’échantillon 


Le renouvellement de |l’échantillon se fait automatique- 
ment au moyen du "Systeme de conception de |’echantillon", 
qui détermine quelles unités doivent étre introduites dans 
l'échantillon de chaque enquéte et lesquelles doivent en étre 
supprimées. Ces unités sont traitees manuellement par le 
personnel de la Section du controle et de |’établissement des 
échantillons, qui doit déterminer quelles régions géographi- 
ques sont représentées et former, s'il y a lieu, les unites des 
degrés suivants d’échantillonnage. 


Chaque programme _ informatique de sélection des 
grappes cree des enregistrements de renouvellement qui 
decrivent le plan de renouvellement suivi aprés le prélevement 
de chaque grappe initiale. Ces enregistrements de renouvel- 
lement indiquent l’ordre dans lequel on ajoute 1 aux origines 
aleatoires pour l’échantillonnage des logements dans les 
grappes et l’ordre dans lequel les grappes prelevees dans un 
groupe se succedent. Chaque enregistrement est valide tant 
que le groupe est soumis a |’échantillonnage, jusqu’a concur- 
rence de 40 origines aleatoires. Les enregistrements réunis 
constituent le fichier principal de renouvellement, qui sert au 
renouvellement automatique de l'echantillon. Le fichier est 
modifié chaque fois que les plans de renouvellement sont mis 
a jour (Comme pour la base ouverte d'appartements) et au fur 
et a mesure que les enregistrements deviennent perimes et 
doivent étre remplacés. 


Le renouvellement des meénages se fait de la maniere 
suivante. Sept mois avant la date de l’enquéte, on crée un 
fichier dans lequel on met tous les renseignements relatifs au 
plan de sondage des grappes qui seront introduites dans 
l'echantillon pour cette date. Ce fichier sert a la création 
d'une base de données aux fins de |’etablissement des listes 
et indique au personnel de la Section du contrdle et de 
l'établissement des échantillons les grappes pour lesquelles il 
faut produire des schemas (F01). Les F01 sont envoyees aux 
bureaux régionaux (BR) et doivent y arriver en meme temps 
que le Rapport sur |’état de |’échantillon, qui est lui-méme 
produit 22 ou 23 semaines avant la date d'introduction des 
unites dans |’échantillon et qui indique toutes les nouvelles 
grappes pour lesquelles il faut etablir une liste. Cette operation 
consiste a inscrire sur une ligne distincte de la Liste de la 
grappe (FO2) les renseignements relatifs a chaque logement 
faisant partie de la grappe. 


Les listes sont introduites dans les mini-ordinateurs des 
BR et sont transmises a la base de données centrale. Avant 
la date de !’enquéte, on introduit dans la base de données un 
fichier, créé a partir des enregistrements de renouvellement 
par le Systeme de conception de |l’échantillon, qui contient 
l’origine aléatoire et la fraction de sondage inverse a attribuer 
a chaque grappe de |’echantillon. La selection des ménages 
est ensuite effectuée par echantillonnage systematique des 
listes, et un dossier est imprimé pour chaque ménage choisi. 
Les meénages font partie de |’échantillon pendant six mois (ou 
moins s'ils y ont été introduits au cours d’un mois autre que 
celui qui correspond a leur numéro de renouvellement, par 
exemple dans les régions ou un nouvel eéchantillon est 
introduit progressivement), a la suite de quoi une nouvelle 
série d'origines aleatoires est reservee dans la base de 
données et de nouveaux ménages sont echantillonnés. 


In NSR areas, a rotation record lasts only as long 
aS a group remains in the sample. Thus, as records 
become exhausted, it can be determined which groups 
are exhausted. Then, by referring to the group frame, 
replacement groups are determined. In the groups 
identified as rotating in, Sample Control determines 
their geographical location, and prepares maps of the 
area. Ordinarily, the process of group rotation begins 
at least 30 weeks before the date of introduction of the 
sample. 


With the rotation of PSUs, the subsequent stages 
of selection, namely groups and clusters, will have to 
be carried out, as outlined in Chapter 4. If the area 
was previously clustered, the same random ordering of 
units is used, although a different systematic sample is 
selected. Approximately the same length of time is 
required for replacement of PSUs, since the formation 
and selection of groups is not very time consuming. 


6.4 Assigning Rotation Numbers 


In assigning rotation numbers, the objective is to 
evenly distribute the sample in terms of expected take. 
This distribution is achieved simultaneously for the 
sample as a whole, and at the same time for the 
smallest possible geographical subsets of it. 
Adherence to these objectives implies the following: (i) 
the workload of interviewers is stable, as roughly equal 
numbers of units are rotating each month; (ii) the 
sample is comprised of equal numbers of households 
having been in the sample for 1vs 2... vs6 occasions, 
nullifying time-in-sample effects as a cause of 
differences in estimates between areas, or over time: 
and (iii) the sample is effectively divided into six 
equally representative parts, which may be used when 
sub-samples from the LFS frame are desired. 


To achieve the aforementioned objectives in NSR 
areas, selected clusters were assigned _ rotation 
numbers in such a manner as to balance the total 
expected take within each PSU, stratum and Economic 
Region. The assignment of rotation numbers was 
accomplished independently within each Economic 
Region, but a factor was built in to randomly distribute 
that expected take that remained after equal amounts 
wereassigned to each rotation number. Due to the 
randomness of the procedure, the unbalanced 
expected takes at the regional level should cancel out 
at higher levels. 


Clusters in urban PSUs or urban portions of PSUs 
are blocks or block faces, with typically more than six 
selected per PSU, and with an average sample yield of 
3 dwellings. Clusters in rural PSUs or rural portions of 
PSUs correspond to Census Enumeration Areas, which 
in some cases have undergone splitting or combining. 
For rural PSUs, frequently six clusters are formed with 
all six selected, whereas for rural portions of mixed 
PSUs typically two to three clusters, each with sample 
yields of 10 to 15 dwellings, are selected. 
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Dans les secteurs NAR, |'enregistrement de renouvelle- 
ment demeure valide aussi longtemps que le groupe reste 
dans |'échantillon. On peut ainsi determiner quels groupes 
sont épuisés d’aprés les enregistrements perimes et connaitre 
les groupes de remplacement en consultant la base de 
groupes. La Section du contrdle et de |’établissement des 
échantillons détermine l’emplacement geographique des grou- 
pes devant étre introduits dans |’échantillon et trace la carte 
des secteurs ou ils se trouvent. En général, le renouvellement 
des groupes débute au moins 30 semaines avant la date 
d'introduction de |’echantillon. 


Aprés le renouvellement des UPE, il faut proceder a 
l'échantillonnage des unités suivantes, soit les groupes et les 
grappes, selon la methode décrite au chapitre 4. S’il s’agit 
d’un secteur qui a déja été divisé en grappes, on utilise le 
méme classement aléatoire des unités mais on preleve un 
échantillon systematique different. Il faut prevoir autant de 
temps que pour le remplacement des UPE, car la formation et 
la sélection des groupes ne sont pas des operations tres 
longues. 


6.4 Attribution des numéros de renouvellement 


Le but poursuivi lorsqu’on attribue les numeros de 
renouvellement est de répartir |’echantillon de telle maniere 
que le rendement prevu soit le meme partout, tant au niveau 
de |l’échantillon global que des plus petites unites géogra- 
phiques. Si l'on respecte cet objectif, il en decoule trois 
consequences : (i) la charge de travail des intervieweurs est 
stable, étant donné qu'un nombre a peu pres egal d’unites est 
remplacé chaque mois; (ii) l’échantillon est constitue d’un 
nombre egal de ménages qui en font partie depuis 1, 2, 3, 4,5 
ou 6 mois, ce qui annule l’effet que le nombre de mois passes 
dans |’echantillon pourrait avoir sur les estimations relatives 
aux differents secteurs et a différentes periodes; (iii) l’echan- 
tillon est bien divisé en six parties egalement representatives, 
dont on peut se servir lorsqu’on veut obtenir des sous- 
echantillons de EPA. 


Pour atteindre cet objectif dans les UNAR, on a attribue 
des numeros de renouvellement aux grappes echantillonnees 
de maniere a ce que le rendement prévu de |’échantillon soit 
le meme dans chaque UPE, strate et région économique. 
L’attribution des numeros de renouvellement s'est faite de 
facon independante dans chaque région economique, mais on 
a introduit un facteur permettant de répartir aléatoirement le 
rendement prevu qui restait une fois qu’on avait attribué un 
nombre egal d’unites aux grappes portant chaque numero de 
renouvellement. En raison du caractere aléatoire de cette 
operation, les differences par rapport au rendement prévu au 
niveau de la region devraient s’annuler aux niveaux 
superieurs. 


Dans les UPE urbaines ou la partie urbaine des UPE, les 
grappes sont des ilots ou des cdtés dilot. On en préléve 
generalement plus de six par UPE, dont le rendement prévu 
de l'echantillon est de 3 logements en moyenne. Dans les 
UPE rurales ou les parties rurales des UPE, les grappes 
correspondent a des secteurs de dénombrement du recen- 
sement, dont certains ont ete divisés ou combines a d'autres. 
Dans les UPE rurales, on forme souvent six grappes qui sont 
toutes echantillonnees, tandis que dans les parties rurales des 
UPE mixtes, on préleve généralement 2 ou 3 grappes ayant 
un rendement de !’echantillon de 10 a 15 logements. 


Due to the differences between the size and 
numbers of sampled units in urban and rural areas, the 
first step in balancing the sample take by rotation was 
to balance it as much as possible for the larger rural 
units at the stratum or Economic Region level. Rotation 
numbers were then assigned to the urban units to 
balance the combined rural and urban take at the PSU 
level, as well as the rural and urban separately and 
combined at the stratum and Economic Region levels. 


Initial assignment of rotation numbers for the NSR 
areas took into consideration the entire sample within 
each Economic Region. A running count of the sample 
take by urban and rural parts of PSUs, strata and 
Economic Regions is maintained, and when PSU 
rotation occurs, rotation numbers are assigned first to 
rural and then to urban units, so as to maintain the 
balance in the sample take across rotations 
simultaneously to the degree possible at the PSU, 
stratum and ER levels. 


In SR areas every sub-unit has a multiple of six 
selections so that each rotation group can have the 
same number of selections. The total expected take is 
balanced by areas consisting of individual large cities 
(e.g., Toronto, Montreal) or groups of smaller cities 
within a province. Again, a random procedure to start 
the balancing of each area ensures that the provincial 
totals would also be balanced. 


In the Apartment frame, every set of six selections 
in the systematic sample was assigned the six rotation 
numbers in a random order. No balancing is possible 
in this open-ended frame. For new additions to the list, 
a set of six randomly ordered rotation numbers is 
generated as required. The assignment of rotation 
numbers would entail choosing the next rotation from 
this set. 


In the Special Area frame, the number of 
selections is so small that only a provincial balancing 
of the entire frame was attempted. In this frame the 
occasional group selection may be clustered but all 
cluster selections within the group have the same 
rotation number. 


Sg 


Comme la taille des unités échantillonnées et leur nombre 
ne sont pas les mémes dans les régions rurales et dans les 
regions urbaines, la premiére chose a faire pour uniformiser le 
rendement de |’échantillon a chaque renouvellement a ete 
d'essayer de faire en sorte que celui-ci soit aussi uniforme 
que possible dans les grandes unites rurales au niveau de la 
Strate ou de la RE. On a ensuite attribué les numeéros de 
renouvellement aux unités urbaines en essayant d’uniformiser 
le rendement de |l’échantillon des régions rurales et urbaines 
combinées au niveau des UPE ainsi que des régions rurales 
et urbaines separees et combinees au niveau de la strate et 
de la RE. 


Au moment d’attribuer les premiers numéros de renou- 
vellement aux secteurs NAR, on a tenu compte de 
l'echantillon entier dans chaque RE. On calcule le total 
cumulatif du rendement de |’échantillon selon les parties 
urbaines et les parties rurales des UPE, des strates et des RE 
et, lorsque le renouvellement des UPE a lieu, on attribue des 
numeros de renouvellement aux unites rurales d’abord et aux 
unites urbaines ensuite, de maniére a garder, autant que 
possible, le rendement de |'éechantillon egal en meme temps 
au niveau de |’UPE, de la strate et de la RE. 


Dans les secteurs AR, on preleve six ou un multiple de six 
sous-unités de maniere a ce qu'il y ait le meme nombre de 
sous-unités dans chaque groupe de renouvellement. Le 
rendement prevu total est uniformisé au niveau de regions 
constituees soit d’une grande ville (p.ex. Toronto ou Montreal), 
soit d’un groupe de petites villes d'une meme province. On 
adopte encore une methode a caractere aleéatoire pour 
amorcer |'uniformisation du rendement de l’echantillon dans 
chaque region de maniere a ce que le rendement total dans 
les provinces soit le meme, 


Dans la base d’appartements, on a attribue au hasard les 
six numeéros de renouvellement a chaque série de six unites 
choisies. Il n'est pas possible d’uniformiser le rendement de 
l'echantillon dans cette base ouverte. Pour les nouvelles 
unites qui y sont ajoutees, on génere au besoin une serie de 
six numéros de renouvellement aleatoires. Pour attribuer les 
numéros de renouvellement, il suffit de passer au numero 
suivant de la série. 


Dans la base de secteurs spéciaux, le nombre d'unites 
echantillonnees est si petit qu'on essaie seulement d’uni- 
formiser le rendement de |’echantillon de la base entiere au 
niveau provincial. Il arrive a |’occasion qu'un groupe choisi 
soit divisé en grappes, mais alors on attribue le meme numero 
de renouvellement a toutes les grappes qui y_ sont 
echantillonnees. 
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Chapter 7 


Survey Operations 


7.1 Introduction 


This chapter outlines the activities and 
organization of survey operations. The first section 
identifies the organizational areas involved in survey 
operations and the second gives a schedule of main 
activities for a typical survey. The third and fourth 
sections deal with sample operations and data 
collection activities. The last section describes data 
processing and dissemination. 


7.2 Organization and Responsibility 


This description of survey organization includes 
those areas directly involved with the monthly opera- 
tion of the LFS process, as well as areas that influence 
the survey in important ways, such as changing the 
survey to meet user requirements and_ Statistics 
Canada policy. Except for the Regional Offices (ROs), 
all areas are located in Head Office in Ottawa. 


The Household Surveys Division within Labour and 
Household Surveys Branch is responsible for the 
overall operational control of the LFS. This includes 
setting the questionnaire, processing (edit, imputation, 
coding) the data, tabulating and analysing the monthly 
results and providing client consultation services. The 
Labour and Household Surveys Analysis Division, in 
the same Branch, deals with the detailed analysis and 
continual review of labour market developments as 
revealed by the survey data. It also determines and 
maintains survey concepts and content and engages in 
further data development by sponsoring supple- 
mentary Surveys and analysis. 


The Social Survey Methods Division has overall 
responsibility for the methodology of all household 
surveys. In particular, the division Is responsible for 
directing and conducting the research and develop- 
ment of the LFS methodology. This involves carrying 
out all sample design work (e.g., sampling, rotation, 
updating, estimation, variance estimation and related 
methodological developments, development of evalua- 
tion programs and controls at different stages of the 
operation of the survey, maintenance of the quality of 
the design over time and preparation of sampling 
material for field operations). 


Chapitre 7 


Operations de l’enquéte 


7.1 Introduction 


Ce chapitre décrit les activites menées dans le cadre des 
operations de l’enquéte et l’organisation de ces operations. La 
premiere section indique quelles divisions participent a ces 
operations et la deuxieme donne l’ordre dans lequel les princi- 
pales activites sont accomplies pour une enquéte typique. Les 
deux sections suivantes portent sur |’échantillonnage et la 
collecte des données, et la derniére, sur le traitement et la 
diffusion des donnees. 


7.2 Organisation et responsabilites 


Dans cette description de |’organisation de l’enquete, 
nous parlerons des unites administratives qui participent direc- 
tement aux activites mensuelles de |’EPA ainsi que de celles 
qui ont une influence importante sur |’enquéte, soit en deéter- 
minant les changements a y apporter pour mieux repondre 
aux besoins des utilisateurs, soit en definissant |’orientation du 
Bureau. A l'exception des bureaux regionaux, toutes ces 
unites administratives sont situees au bureau central a Ottawa. 


La Division des enquétes-menages, qui fait partie de la 
Direction des enquetes sur le travail et aupres des menages, 
est chargee de voir a ce que l'ensemble des operations de 
l'enquete soient menees a bien. Cela comprend |'élaboration 
du questionnaire, le traitement des donnees (controle, impu- 
tation, codage), la totalisation des donnees, l’'analyse des 
resultats mensuels et les services de consultation aupres des 
clients. La Division de l’analyse des enquetes sur le travail et 
les ménages, qui fait partie de la méme direction, s'’occupe de 
l'analyse detaillee et de l’examen continu de |’evolution du 
marche du travail revelee par les donnees de |’enquéte, de la 
définition des concepts et de la determination du contenu ainsi 
que de leur mise a jour s'il y a lieu et enfin de la production 
d'autres données par la tenue d’enquétes supplementaires et 
l'analyse de leurs resultats. 


La Division des methodes d’enquétes sociales a la res- 
ponsabilite de la methodologie de toutes les enquétes-mena- 
ges. En ce qui concerne |’EPA, elle est chargee de diriger et 
de realiser la recherche et le developpement ayant trait a la 
methodologie de cette enquéte. Ces taches comprennent tout 
le travail lié a |’elaboration du plan de sondage, c’est-a-dire a 
l’echantillonnage, au renouvellement et a la mise a jour de 
l’echantillon, a la production des estimations et a |’estimation 
de la variance, ainsi que les travaux methodologiques con- 
nexes, l’elaboration des programmes d’evaluation et des 
contrdéles appliques a diverses etapes de la realisation de 
l'enquéte, le maintien de Ja qualite du plan de sondage et la 
preparation des documents nécessaires a |’echantillonnage 
pour les operations sur le terrain. 


Field work related to data collection is the 
responsibility of the Survey Operations Division in the 
Regional Operations Branch. The Head Office is 
responsible for the functional management of the data 
collection and capture activities. This involves 
supplying the Regional Offices with all necessary 
survey forms; generating training manuals, exercises, 
survey guides and information packages; conducting 
training sessions; and scheduling the data collection, 
capture and transmission operations. 


Actual data collection is carried out by a team of 
800 interviewers working under the direct supervision 
of eight Regional Offices located in St. John’s, 
Newfoundland; Halifax, Nova Scotia; Montreal, Quebec; 
Sturgeon Falls, Ontario; Toronto, Ontario; Winnipeg, 
Manitoba; Edmonton, Alberta and Vancouver, British 
Columbia. These offices are responsible for the field 
work related to the LFS, as well as the Census, and 
many other household, institutional and business 
surveys. Their duties include recruitment, hiring and 
training of interviewers, listing of selected clusters and 
related map work, data collection, data capture and 
maintenance of quality control over these functions. 


The Informatics Services and Development Divi- 
sion in the Informatics Branch oversees the network of 
minicomputers located in each RO and Head Office. 
This system transmits data for pre-printing survey 
forms and for receiving survey data. The division is 
also responsible for maintaining the majority of the 
software and mainframe computer operations related to 
all aspects of the survey, from sampling to weighting 
and tabulation. 


Because no one area is responsible for all aspects 
of the survey, several coordinating groups are needed 
to (1) ensure that issues are brought to the attention of 
the appropriate area and (2) help the exchange of 
information between these areas. This coordination is 
provided through the following committees, which meet 
regularly. 


1. Operations Committee — chaired by a member of 
the Household Surveys Division. 


2. Content Consultation Group - chaired by a 
member of the Labour and Household Surveys 
Analysis Division. 


3. Data Quality Committee — chaired by a member of 
the Social Surveys Methods Division. 


4. Redesign Committee - chaired by a member of 
the Social Survey Methods Division. 
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Les opérations sur le terrain ayant trait a la collecte des 
données relevent de la Division des operations des enquétes, 
qui fait partie de la Direction des opérations regionales. Le 
bureau central assume la direction fonctionnelle de la collecte 
et de la saisie des données. Il doit notamment fournir aux 
bureaux régionaux toutes les formules d’enquéte nécessaires, 
produire les manuels de formation, les exercices, les guides et 
les trousses d’information, offrir la formation et etablir le 
calendrier des opérations de collecte, de saisie et de trans- 
mission des données. 


La collecte-méme des données est effectuee par une 
équipe de 700 intervieweurs qui sont directement supervises 
par les huit bureaux régionaux situes respectivement a St. 


John’s (Terre-Neuve), Halifax (Nouvelle-Ecosse), Montreal 
(Québec), Sturgeon Falls (Ontario), Toronto (Ontario), 
Winnipeg (Manitoba), Edmonton (Alberta) et Vancouver 


(Colombie-Britannique). Ces bureaux sont charges de l|’ac- 
complissement du travail sur le terrain pour |’EPA, mais aussi 
pour le recensement et un grand nombre d'autres enquétes 
menées aupres des meénages, des eétablissements institu- 
tionnels et des entreprises. Parmi leur fonctions, signalons 
celles de recruter, d’embaucher et de former les _ inter- 
vieweurs, d’établir les listes pour les grappes echantillonnees 
et de préparer les cartes s’y rapportant, de recueillir et de 
saisir les données et enfin de controler la qualite de ces 
activités. 


La Division des services et du développement informa- 
tiques, a la Direction de l’informatique, s’occupe du réseau de 
mini-ordinateurs, lesquels sont situeés dans chaque BR et au 
bureau central et ont pour fonction de transmettre les 
données, d'imprimer certains renseignements sur les formules 
d’enquéte et de recevoir les données d’enquéte. La Division 
est aussi chargee d’effectuer la plupart des activites infor- 
matiques, du point de vue des logiciels comme de |’ordinateur 
central, qui ont trait a tous les aspects de l’enquéte, de 
l'echantillonnage a la pondeération et a la totalisation des 
données. 


Comme il n'y a pas une unité administrative qui a la 
responsabilite de tous les aspects de l’enquéte, on a besoin 
de plusieurs groupes de coordination pour veiller a ce que les 
dossiers soient acheminés aux unites compeétentes et pour 
facilite l'echange d'information entre celles-ci. Les comites 
Suivants, gui se reunissent a intervalles réguliers, remplissent 
cette fonction. 


1. Comité des opérations — présidé par un membre de la 
Division des enquétes-ménages. 


2. Groupe de consultation sur le contenu — présidé par un 
membre de la Division de l’analyse des enquétes sur le 
travail et les menages. 


3. Comite de la qualité des données — présidé par un mem- 
bre de la Division des méthodes d’enquétes sociales. 


4. Comite du remaniement — présidé par un membre de la 
Division des meéthodes d’enquétes sociales. 


7.3 Survey Schedule 


The sequence of operations can be understood by 
examining the activities as they relate to the survey 
process for a particular month. 


First, all clusters that are selected or are soon to 
be selected, have lists of dwellings which are 
maintained on the main computer in Ottawa. Five to six 
weeks prior to survey week the sample is selected. 
This entails identifying the dwellings associated with 
random starts and systematic samples in all clusters 
that are active for that particular survey. Specification 
of the sample dwellings is sent to the ROs to prepare 
the interviewer assignments. 


Three weeks prior to survey week, information for 
all selected dwellings is sent to the ROs. For dwellings 
entering the survey for the first time (i.e., births), this 
consists only of control information. For the five-sixths 
of the sample dwellings that were in the survey during 
the previous month, this consists of control information 
as well as selected information from the survey forms 
from the previous month. The following week (two 
weeks prior to survey week) packages of survey 
materials are prepared by RO staff and shipped to the 
interviewers. The week prior to survey week is used by 
interviewers to plan their work. This includes 
scheduling when interviews will be conducted during 
the next week, and planning a route to follow for 
conducting face-to-face interviews. Interviews are con- 
ducted from Monday to Saturday of survey week and 
interviewers are instructed to return all completed 
survey documents to ROs daily. 


Regional Office processing of returned survey 
documents begins on the Tuesday of survey week. 
Forms are batched, sent for data capture and capture 
verification on the minicomputer network. The 
completed batches are then transmitted to Ottawa. 
Transmissions occur nightly, with the final cut-off 
usually set as the Wednesday night of the week after 
survey week. 


Editing and coding of the survey data begins on 
the Wednesday of survey week. This processing, done 
at Head Office, continues until the Thursday of the 
week after survey week, with weighting and tabulation 
done on the Friday. The steps involved in Head Office 
processing are further described in section 7.7. 


Text for publication and dissemination Is prepared 
and translated between the Tuesday and Thursday of 
the second week following survey week. Data for the 
particular survey is first released at 7 a.m. on the 
Friday of this week. 
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7.3 Calendrier de l’enquéte 


On peut voir dans quel ordre les operations se déroulent 
en examinant les activites liees a la tenue de |l’enquéte qui 
sont accomplies au cours d'un mois. 


Tout d’abord, pour chaque grappe échantillonnée ou sur 
le point de |’étre, il y a une liste de logements qui est tenue a 
jour dans l’ordinateur principal a Ottawa. Entre cing et six 
semaines avant la semaine d’enquéte, on preléve |’échantillon. 
ll s'agit pour cela de déterminer quel logement correspond a 
l'origine aléatoire puis de former un eéchantillon systematique 
dans chaque grappe qui est active ce mois-la. Tous les détails 
concernant les logements de |’echantillon sont envoyes aux 
BR afin qu'on y prepare les taches des intervieweurs. 


Les renseignements sur les logements échantillonnés 
sont expedies aux BR trois semaines avant la semaine 
d’enquete. Pour les logements introduits dans I'echantillon ce 
mois-la (les nouveaux dossiers), il s’agit de données de 
controle. Pour les autres (les cinq sixiemes des logements 
echantillonnes), il s'agit de données de controle et de rensei- 
gnements tires des formules d’enquéte du mois precedent. La 
semaine suivante, soit deux semaines avant la semaine d’en- 
quéte, le documents d’enquéte sont reunis par le personnel 
des BR et expedies aux intervieweurs. Les intervieweurs 
consacrent la semaine préceédant la semaine d’enquéte a la 
planification de leur travail. Notamment, ils fixent I’horaire des 
interviews et tracent litinéraire qu’ils suivront pour effectuer 
celles-ci. Les interviews sont menées du lundi au samedi de la 
semaine d’enquéte et les intervieweurs doivent retourner les 
documents remplis au BR au jour Je jour. 


Le dépouillement des documents d’enquéte recus au BR 
commence le mardi de la semaine d’enquéte. Les formules 
sont mises en lots et envoyees pour que les donnees soient 
saisies et la saisie, verifiee, sur mini-ordinateur, apres quoi les 
lots sont transmis a Ottawa. La transmission se fait tous les 
soirs jusqu’a la date limite, habituellement fixee au mercredi 
soir de la semaine suivant la semaine d’enquete. 


La verification et le codage des donnees d’enquete de- 
butent le mercredi de la semaine d’enquéte. Ces operations, 
qui se deroulent au bureau central, se poursuivent jusqu’au 
jeudi de la semaine suivant la semaine d’enquete, et sont 
suivies de la ponderation et de la totalisation des donnees qui 
ont lieu le vendredi. La section 3.5 contient plus de details sur 
les étapes du traitement des donnees qui se deroulent au 
bureau central. 


Le texte qui sera publié et diffuse est réedige et traduit 
entre le mardi et le jeudi de la deuxieme semaine suivant la 
semaine d'enquéte. La premiere diffusion des données tirees 
de l’enquéte a lieu a 7 heures le vendredi de cette meme 
semaine. 


7.4 Sampling Activities 


The Sample Control unit of Social Survey Methods 
Division maintains the survey sample. This involves (1) 
identifying in advance those sample units that will be 
rotating into and out of the sample; (2) forming the 
necessary sample units (i.e., clusters); (3) preparing 
the necessary maps for use by interviewers; and (4) 
identifying the systematic samples of dwellings from 
within clusters each month. 


Counting 


Approximately a year in advance, the Sample 
Control unit identifies new NSR Primary Sampling 
Units to be introduced. Maps of the PSUs, which show 
their locations, are sent to the Regional Offices to allow 
the ROs to determine if and where new interviewers 
might have to be hired. 


The most recent Census data on counts and 
plotting of dwellings are used to sub-divide the PSUs 
into clusters of required size. If counts or plots are not 
adequate, additional maps of the area are prepared 
and sent to the Regional Offices for field counting. 
Field counting consists of visiting the area and 
identifying all dwellings within the boundaries. These 
are shown on the maps as counts of dwellings between 
obvious permanent geographic features (rivers, roads 
etc.). Once the count maps are received by the 
Sample Control Unit, the areas are divided into 
clusters. 


Clustering 


Clustering consists of dividing a large area into 
smaller areas according to criteria related to optimum 
density factors and sampling rates within the stratum. 
In urban places, clusters consist of blocks, groups of 
blocks or block faces. In rural areas clusters are 
usually Census Enumeration Areas (EAs). Where EA 
dwelling counts are too large or too small, EAs are split 
or combined to ensure enough clusters to represent all 
six rotation groups. 


About six months before interviewing, all clusters 
that are to be introduced, in both SR and NSR areas, 
are identified. Clusters are sketched on Cluster 
Diagrams (Form 01), which have control information 
pre-printed on them. The Cluster Diagrams are then 
shipped to the ROs, where they are matched with pre- 
printed Listing Forms (Form 02) and sent to inter- 
viewers for listing the dwellings. 


Listing 


During the listing procedure each dwelling is 
assigned a unique listing line number and is recorded 
on the Form 02 by its street address or a description. 
All dwellings that can be determined as being habitable 
(whether vacant or occupied) and that are within the 
boundaries as outlined on the Cluster Diagram, are 
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7.4 Activites d’echantillonnage 


La Sous-section du contréle de |’échantillon de la Division 
des méthodes d’enquétes sociales s’occupe de la mise a jour 
de l’échantillon. C'est la qu'on détermine d’avance quelles 
unites seront introduites dans |l’echantillon et lesquelles en 
seront supprimées, qu'on forme les unites d’echantillonnage 
nécessaires (les grappes), qu’on prépare les cartes dont les 
intervieweurs auront besoin et qu’on constitue chaque mois 
les eéchantillons systematiques de logements dans les 


grappes. 
Dénombrement 


On détermine environ un an a |’avance les nouvelles UPE 
NAR a introduire dans |’echantillon. On envoie des cartes des 
UPE montrant leur emplacement aux BR pour permettre a ces 
derniers de décider s'il faudra embaucher de nouveaux inter- 
vieweurs et, le cas echeant, dans quelles régions. 


On se sert des données du dernier recensement sur le 
nombre de logements et leur emplacement pour subdiviser 
les UPE en grappes de la taille requise. Si ces données ne 
sont pas adéquates, on trace de nouvelles cartes des regions 
et on les envoie aux BR pour quiils procedent au denom- 
brement sur le terrain. Le denombrement sur le terrain con- 
siste a visiter la region et a relever tous les logements qui se 
trouvent a l’intérieur des limites de |'UPE. Le nombre de loge- 
ments qui se trouvent entre des caractéristiques physiques 
permanentes (rivieres, routes, etc.) est alors indiqué sur les 
cartes. Des que ces cartes sont recues a la Sous-section du 
controle de l’échantillon, on procede a la formation des 


grappes. 
Formation des grappes 


Pour former les grappes, on divise une grande region en 
de petites régions selon des criteres se rapportant aux 
facteurs de densité optimale et aux fractions de sondage dans 
la strate. Dans les régions urbaines, les grappes sont des 
lots, des groupes d’ilots ou des cotes dilot, tandis que dans 
les régions rurales ce sont géneralement des secteurs de 
déenombrement du recensement. Les SD ou le nombre de 
logements est trop élevé ou trop faible sont, selon le cas, 
subdivisés Ou combines afin qu’on puisse former le nombre 
de grappes nécessaires pour représenter les six groupes de 
renouvellement. 


Environ six mois avant le début prévu des interviews, on 
determine quelles grappes seront introduites dans |’échantillon 
des secteurs AR et des secteurs NAR. Celles-ci sont dessi- 
nees sur les Formule 01 (schémas de grappe) sur lesquelles 
des données de contrdle sont préimprimeées. Les schemas de 
grappe sont expediés aux BR ou l'on y joint les formules de 
listage (formules 02) correspondantes, et le tout est envoyé 
aux intervieweurs en vue du listage des logements. 


Listage 


Le listage consiste a attribuer a chaque logement un 
numero de ligne de listage qui lui est propre et a représenter 
ce logement sur la formule 02 par son adresse de voirie ou 
une description. Tous les logements habitables, qu’ils soient 
vacants Ou occupeés, a |’intérieur des limites indiquées sur le 
schema de grappe sont inscrits sur la liste. On considére 


listed. Listed as a dwelling is any set of living quarters 
that (i) is structurally separate from the living quarters 
of other dwellings and (ii) has a private entrance 
outside the building or a private entrance from a 
common hall or stairway inside the building. The 
entrance must be one that can be used without passing 
through the living quarters of another dwelling. 


Collective Dwellings 


Structures that are intended to accommodate ten 
or more unrelated persons are considered collective 
dwellings. These include religious institutions, homes 
for the aged, hostels, YWCAs, YMCAs, hospitals, 
nursing homes, hotels, motels, boarding houses, 
construction or mining bunk houses, etc. When a 
collective dwelling is encountered during listing it is 
temporarily assigned one listing line and details about 
the dwelling are reported to the Sample Control Unit at 
Head Office. The Sample Control staff research the 
Census data available on the collective to determine 
first, if the dwelling is a component of the Special Area 
Frame and therefore should be excluded from the area 
cluster; second, if, based on the type of dwelling, some 
of the residents are considered inmates and therefore 
to be excluded from enumeration; and third, the 
appropriate number of listing lines to allocate to the 
dwelling to accommodate the non-inmate residents. 
Collective Dwellings of less than ten residents are 
automatically allocated one listing line. A dwelling 
occupied by a single family of ten or more persons 
would not be considered a collective dwelling. 


The period of time allowed for listing serves two 
functions in the Regional Office. First, it allows 
flexibility in scheduling listing at the most convenient 
time to minimize travel and other costs. Second, it 
allows adjustment to interviewer assignments for 
changes in the sample location or expected sample 
take. 


Sub-sampling Growth Areas 


Because of the systematic selection of dwellings 
from clusters, a cluster that has experienced consi- 
derable growth would have a corresponding increase In 
expected sample take. This is normally accounted for 
by adjusting assignments among existing interviewers 
or, if necessary, by creating new assignments. If these 
methods prove too costly and the increase Is 
significant, ROs may request that the cluster be sub- 
sampled. This is done in the Sample Control Unit by 
either sub-dividing the cluster into several sub-clusters 
and sampling some of them or by amending the 
cluster sampling rate to reduce the sample take. In 
either case a cluster dwelling weight Is calculated to 
compensate for the sub-sampling and this weight Is 
assigned to each dwelling in that cluster during the 
weighting process. 
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comme un logement les pieces d'habitation qui : (1) sont 
Structurellement distinctes des pieces d'habitation d'autres 
logements; (2) ont soit une entrée privée a |'extérieur de 
l'immeuble soit une entrée privée donnant sur un couloir ou un 
escalier commun a l'interieur de l'immeuble. On doit pouvoir 
utiliser l'entrée sans avoir a traverser les pieces d'habitation 
d'un autre logement. 


Logements collectifs 


On considére comme des logements collectifs les cons- 
tructions (etablissements religieux, foyers pour personnes 
agees, YWCA, YMCA, hopitaux, maisons de soins infirmiers, 
hotels, motels, maisons de chambres et pensions, camps de 
chantier ou sont les logés les mineurs et les travailleurs de la 
construction, etc.) prevues pour I’hebergement d’au moins 10 
personnes non apparentees. Lorsqu’on tombe sur un loge- 
ment collectif pendant le listage, on lui attribue temporai- 
rement une ligne de listage et on en signale |'existence a la 
Sous-section du contrdéle de |'échantillon au bureau central. 
Le personnel de la Sous-section consulte les donnees de 
recensement sur le logement collectif pour determiner, pre- 
mierement, si ce logement fait partie de la base de secteurs 
speciaux et devrait donc étre exclu de la base areolaire, 
deuxiemement s'il s’agit d’un logement dont les occupants 
sont consideres comme des pensionnaires d'etablissement 
institutionnel et qui devrait donc etre exclu du denombrement 
et, troisiemement, si le logement collectif doit rester dans la 
grappe, combien de lignes de listage lui attribuer compte tenu 
du nombre de résidents. On attribue automatiquement une 
ligne de listage aux logements collectifs habités par moins de 
10 personnes. On ne considere pas comme un jogement col- 
lectif un logement occupé par une seule famille de 10 
personnes ou plus. 


La période réservee au listage remplit deux roles. 
Premierement, elle donne suffisamment de jeu pour qu'on 
puisse organiser cette activite au moment qui permet de 
reduire au maximum les couts, de deplacement et autres. 
Deuxiemement, elle permet de modifier la tache des inter- 
vieweurs si l'emplacement des unites ou le rendement prevu 
de |’echantillon changent. 


Sous-échantillonnage dans les régions en expansion 


Comme les logements sont preleves dans les grappes 
par la methode d’échantillonnage systematique, si la popu- 
lation d’une grappe s'accroit considerablement, le rendement 
prevu de |’echantillon augmente en consequence. On reagit 
normalement a cette situation en repartissant les nouveaux 
logements entre les intervieweurs ou, s'il le faut, en creant de 
nouvelles taches. Mais si cette solution revient trop cher et 
que la croissance de la population est vraiment trop grande, le 
BR peut demander que la grappe en cause soit sous- 
échantillonnée. La Sous-section du contrdle de |'echantillon 
sen charge, et elle peut soit former des sous-grappes a partir 
de la grappe et en echantillonner quelques-unes, soit modifier 
la fraction de sondage pour reduire le rendement de 
l’echantillon. Dans un cas comme dans |'autre, on calcule un 
poids ayant pour objet de compenser l'effet du sous-echan- 
tillonnage et on l’attribue a chacun des logements de la 
grappe a |’étape de la ponderation. 


All listing information is captured on the RO 
minicomputers and transmitted to head office. ROs are 
requested to transmit listings approximately 13 weeks 
before interviewing starts. This allows time for 
confirmation that the listings have been entered into 
the main computer and ensures that the information 
can be verified prior to the selection of dwellings, 
which occurs six weeks prior to interviewing. 


Sample Selection 


The Sample Control Unit maintains the sampling 
programs, which specify the sampling parameters 
(survey date, survey identification, random start and 
sampling ratio). These programs are used to select 
dwellings belonging to the specific rotation group of 
the particular month. They identify the line numbers 
representing the dwellings that are to be interviewed. 
At the same time, the program assigns a unique 
Docket Number to each selected line number. 
Additional programs create a control file of all Docket 
Numbers, which in effect becomes the file for which 
survey data is expected. The results of the sampling 
are transmitted back to the Regional Offices and there, 
new Listing Forms are printed showing all dwellings, 
and those that have been selected for the forthcoming 
survey. At the same time, the other survey forms 
(Household Record Docket F03, Labour Force Ques- 
tionnaire FO5, Rent Schedule F04 and Supplementary 
Survey Questionnaire FO6) are pre-printed with control 
information. 


7.5 Maintenance 
Volumes 


Prior to the 1981 LFS redesign, there were 
approximately 12,000 clusters active at any given time 
in the survey and approximately 900 clusters needed 
to be replaced each month. With the elimination of a 
stage of selection and with the increased size of 
clusters in the NSR in the new design, there are 
approximately 11,000 active clusters with about 300 
needing replacement each month. 


Frame 


All clusters in SR areas were determined at the 
time of redesign. Maps covering all SR areas and 
showing all clusters are maintained in the Sample 
Control Unit and are used when it is necessary to draw 
Cluster Diagrams for replacement clusters or to resolve 
boundary problems that may be reported from the 
field. 


As time passes the counts assigned to clusters 
become outdated due to differential growth rates and 
other city development. Although estimates remain 
unbiased, their variance increases. For this reason, the 
SR Update Program is maintained between major 
redesigns. Under this program independent sources 
are used to identify SR areas where growth or other 
factors have made counts obsolete. These sources 
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Tous les renseignements relatifs au listage sont introduits 
dans les mini-ordinateurs des BR et transmis au bureau 
central. Les BR doivent transmettre les listes environ 13 
semaines avant le début des interviews. Cela laisse le temps 
de confirmer que les listes ont bien ete introduites dans 
‘ordinateur principal et de verifier les renseignements avant 
l'échantillonnage des logements, six semaines avant les 
interviews. 


Prélevement de Il’échantillon 


La Sous-section du contrdle de |l’échantillon assure la 
maintenance des programmes d’échantillonnage qui precisent 
les parametres (date de |l’enquéte, identification de |l’enquéte, 
origine aléatoire et fraction de sondage) dont on se sert pour 
choisir les logements dans le groupe de renouvellement 
utilisé un certain mois. Ces programmes choisissent les nu- 
méros de ligne correspondant aux logements ou les interviews 
vont avoir lieu. Ils attribuent en meme temps un numero de 
dossier a chaque numéro de ligne (logement) choisi. D’autres 
programmes creéent un fichier de controle contenant tous les 
numéros de dossier, c’est-a-dire l'identification des menages 
au sujet desquels on s’attend a recueillir des données 
d’enquéte. Le résultat de l’echantillonnage est renvoye aux 
BR, ou de nouvelles formules de listage sont imprimees 
indiquant tous les logements et ceux qui ont ete echan- 
tillonnés pour l’enquéte suivante. Les données de controle 
sont également imprimeées sur les autres formules d’enquéte 
(Dossier du ménage, F03, Questionnaire de l’enquéte sur la 
population active, FO5, Questionnaire sur le loyer, FO4, et 
Questionnaire de l’enquéte supplementaire, FO6). 


7.5 Mise a jour 
Nombre de grappes 


Avant le remaniement, il y avait en tout temps environ 
12,000 grappes actives dans |’échantillon de l’enquéte et 
environ 900 grappes a remplacer chaque mois. Maintenant 
qu’un degré d’échantillonnage a éte éliminé et que la taille 
des grappes dans le nouveau plan de sondage des secteurs 
NAR a ete agrandie, il y aura environ 11,000 grappes actives 
dont 300 devront étre remplacees chaque mois. 


Base de sondage 


Toutes les grappes dans les secteurs AR ont été déter- 
minees au moment du remaniement. Les cartes de ces 
secteurs, sur lesquelles les grappes sont représentées, sont 
conservees et mises a jour par le personnel de la Sous- 
section du controle de |’échantillon qui s’en sert pour tracer 
les schemas des grappes de remplacement ou pour resoudre 
les problemes de délimitation signalés par le personnel sur le 
terrain. 


Le nombre de logements dans les grappes devient 
inexact au fil du temps en raison des écarts de croissance 
d’une region a une autre et de la facon dont les villes 
evoluent. Bien que les estimations demeurent non biaisées, 
leur variance augmente. C’est pour cela qu'on applique le 
programme de mise a jour des secteurs AR entre les 
remaniements. Ce programme fait appel a des sources 
independantes, notamment les dossiers administratifs tenus 


may be administrative records maintained in municipal 
offices or data from the quinquennial census. New 
counts are then obtained for clusters. These counts 
come from census or from actual field counts. Where 
necessary, large clusters are sub- divided. New 
selections are then made within random groups to 
maximize the retention of originally selected clusters. 


Maps for NSR Primary Sampling Units showing all 
clusters are only available for selected PSUs. As new 
PSUs are selected, sets of maps are prepared and 
maintained in the Sample Control Unit. 


The separate Apartment Sample Frame is an 
open-ended list of all apartment buildings in 18 of the 
largest cities. Each month the Sample Control Unit 
receives lists of apartment building completions from 
Central Mortgage and Housing Corporation. For cities 
that have a separate Apartment frame, Apartment 
Cards are completed for all apartment projects of 30 or 
more units. The cards are then sent to the ROs for 
additional information to confirm the eligibility of the 
building for inclusion in the Apartment Frame. Eligible 
buildings are those with 30 or more units and five or 
more floors of living quarters. These buildings are 
added to the frame when the completed cards are 
returned from ROs. In an apartment frame, each 
apartment building is a separate cluster. Apartment 
buildings, whether in the apartment frame or located in 
an area cluster, are listed by allocating one listing line 
to each unit. 


Each Cluster List is in fact open-ended. New 
dwellings constructed within the boundaries of the 
cluster are added to the list by the interviewer when he 
or she visits the cluster. Dwellings are added when 
they become habitable. Information printed on the 
Form 02 indicates which of these additions to the list 
fall into the systematic sample and therefore must be 
enumerated. 


Special Surveys 


The LFS Sample Frame and sampling procedures 
are also used to conduct special surveys, such as the 
Survey of Consumer Finance, the Food Expenditure 
Survey and the Family Expenditure Survey. When a 
special sample is selected, systematic samples re- 
presented by random starts that have not yet been 
used by the LFS are selected from cluster lists. This 
procedure ensures that the samples are independent 
of the LFS but are located for the most part within 
already active clusters. Thus, field costs related to 
counting and listing are minimized. Listing and 
counting would only be necessary if there are no more 
starts within a cluster or PSU that have not been used. 
The programs, or parallel ones, used for controlling the 
sample can be used to generate Listing Forms specific 
to the special survey (a separate code is used to 
identify dwellings reserved for special surveys). The 
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par les municipalités et les données tirees du recensement 
quinquennal, pour repérer les secteurs AR sur lesquels les 
chiffres ne sont plus bons soit a cause de la croissance de la 
population soit a cause d'autres facteurs. On obtient alors de 
nouveaux chiffres de population pour les grappes provenant 
du recensement ou d'un dénombrement sur le terrain, et, s'il 
le faut, on subdivise les tres grandes grappes. On préléve 
ensuite un echantillon dans les groupes aléatoires de maniere 
a conserver le plus grand nombre possible de grappes qui 
avaient eté choisies au départ. 


On ne dispose de cartes représentant toutes les grappes 
que pour certaines UPE dans les secteurs NAR. Au fur et a 
mesure que de nouvelles unites sont echantillonnees, de 
nouvelles cartes sont tracées et tenues a jour a la Sous- 
section du controle de |’échantillon. 


La base de sondage des appartements est une liste 
ouverte de tous les immeubles d’appartements dans les 18 
plus grandes villes du Canada. Chaque mois, la Sous-section 
du controle de l’echantillon recoit de la Societe canadienne 
d'hypotheques et de logement la liste des immeubles dont la 
construction est achevee. On remplit une fiche d’appartement 
pour chacun des immeubles de trente unites ou plus cons- 
truits dans les villes qui ont leur propre base d’appartements 
et on envoie cette fiche au BR en vue de recueillir des 
renseignements supplementaires qui permettront de confirmer 
si l'immeuble devrait bien figurer dans la _ base. Les 
immeubles admissibles sont les immeubles de cing etages ou 
plus qui comptent au moins trente unites; ils sont ajoutes a la 
base aussitot que les fiches remplies reviennent des BR. Dans 
une base d’appartements, chaque immeuble constitue une 
grappe distincte. Lorsqu’on fait la liste de grappe pour un 
immeuble d’appartements, que celui-ci fasse partie de la base 
d’appartements ou de la base aréolaire, on attribue une ligne 
de listage a chaque unite. 


Chaque liste de grappe est ouverte. Quand |'intervieweur 
visite la grappe, il ajoute a la liste les nouveaux logements qui 
y ont été construits aussitot que ceux-ci deviennent habi- 
tables. Les renseignements imprimes sur la formule 02 
indiquent lesquels des immeubles ajoutés a la liste font partie 
de |'échantillon systematique et doivent donc participer a 
l’enqueéte. 


Enquétes speciales 


On a recours a la base de sondage et aux methodes 
d'echantillonnage de |’EPA pour prelever l’echantillon des 
enquétes speciales comme l'enquete sur les finances des 
consommateurs, |’enquéte sur les dépenses alimentaires et 
l'enquéte sur les depenses des familles. Pour former |'echan- 
tillon d'une enquéte speciale, on preleve des echantillons 
systematiques dans les listes de grappe en partant d’origines 
choisies au hasard dont on ne s'est pas encore servies pour 
EPA. On s’assure ainsi que les echantillons sont distincts de 
celui de l'EPA mais que les unites se trouvent pour la plupart 
dans des grappes actives, ce qui reduit au maximum le cout 
des activites sur le terrain comme le denombrement et 
|'etablissement des listes. Ces activites deviennent neces- 
saires uniquement lorsque toutes les origines aleatoires dans 
une grappe ou dans une UPE ont deja ete utilisees. On peut 
se servir des programmes utilises pour controler |’echantillon 
ou de programmes semblables pour geneérer les formules de 


flexibility in the design also allows sample units to be 
reserved in clusters or PSUs which the LFS will never 
use. 


7.6 Data Collection and Capture Activities 


This section outlines the main steps in the data 
collection stage of the survey. These functions are 
carried out by staff in the eight Regional Offices. Each 
Regional Office is responsible for receiving the 
computer files from Head Office. These files specify 
the sample and print the necessary forms, preparing 
assignment packages, shipping assignments to inter- 
viewers, Supervising interviewing, receiving completed 
survey documents, data capture and transmission to 
Head Office. 


Assignment Planning 


Five to six weeks before a particular interview 
week, the RO receives, via the minicomputer network, 
a cluster file which identifies all the clusters that will be 
active in the sample. An assignment planning report is 
then produced. Clusters that have been exhausted are 
removed and new ones are added. 


For each new cluster coming into the survey, 
regional managers of the LFS identify the assignment 
number to which the cluster will be allocated, the 
interviewer number, the language that will be used for 
printing survey forms, and the printing priority for the 
assignment. Changes to assignments (such as re- 
placing an interviewer) are also made at this time. New 
and changed entries to the assignment planning report 
are transmitted to Head Office no later than four weeks 
before the survey week in question. This information 
will be used to control the priority of printing assign- 
ments, the correct language of survey forms for the 
assignment and the batching together of all pre-printed 
forms for each assignment. 


Assignment Preparation 


The survey cycle for a given month actually 
begins when the processing of the data from the 
previous month ends. Information for each dwelling 
selected for the month in question is transmitted from 
Head Office two to three weeks prior to survey week. 
This allows time for printing the survey forms and 
sending assignments to interviewers. For the dwellings 
entering the survey for the first time only control 
information is transmitted, which is taken from the 
cluster listings. For the five- sixths of the sample that 
was in the survey in the previous month, selected data 
from the Household Record Docket and each ques- 
tionnaire are also included. With this information, 
survey forms for the current month are printed (F03, 
FO4, FO5, and FO6, if applicable). 
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listage propres a l'enquéte spéciale (un code distinct permet 
de signaler les logements réserves aux enquetes speciales). 
Cette caractéristique du plan de sondage permet aussi de 
réserver des échantillons dans les grappes ou les UPE qui ne 
seront jamais utilisees pour |’EPA. 


7.6 Collecte et saisie des donnees 


Dans cette section, nous allons décrire les principales 
étapes de la collecte des données. Les fonctions qui y sont 
associées sont exécutées par le personnel des huit bureaux 
régionaux, dont les responsabilites sont les suivantes : rece- 
voir les fichiers informatiques provenant du bureau central qui 
indiquent quelles unites font partie de l’echantillon et per- 
mettent d’imprimer les formules necessaires, preparer les 
documents de la tache, envoyer ces documents aux inter- 
vieweurs, superviser les interviews, recevoir les documents 
remplis, saisir les données et transmettre celles-ci au bureau 
central. 


Planification des taches . 


Cinq ou six semaines avant la semaine ou les interviews 
doivent avoir lieu, le BR recoit, par le reseau de mini- 
ordinateurs, un fichier de grappes indiquant toutes les grappes 
qui seront actives dans l’échantillon, et un rapport de 
planification de la tache est produit. Les grappes epuisées 
auront eté retirees de ce fichier et les nouvelles grappes y 
auront été ajoutees. 


Les chefs régionaux de |’EPA indiquent les renseigne- 
ments suivants au sujet de chaque nouvelle grappe introduite 
dans l’échantillon : le numéro de la tache dont chaque grappe 
fera partie, le numero de l’intervieweur, la langue dans laquelle 
les formules d’enquéte seront imprimees et l’ordre d’im- 
pression des documents de la tache. C’est a cette etape aussi 
que sont effectues les changements concernant les taches 
comme le remplacement des intervieweurs. Les ajouts et les 
modifications apportés au rapport de planification de la tache 
sont communiques au bureau central dans les quatre se- 
maines précédent la semaine d’enquéte. On se servira de 
ces renseignements pour verifier si l'ordre d’impression des 
documents de la tache est respecte, si les formules d’enquéte 
sont dans la bonne langue et si toutes les formules pré- 
imprimees relatives a une tache ont été correctement mises 
en lot. 


Préparation de la tache 


Le cycle de l’enquéte pour un mois donné commence 
aussitot que s’acheve le traitement des données relatives au 
mois precedent. Les renseignements concernant chaque loge- 
ment dans l’echantillon pour le mois en cours sont transmis au 
bureau central deux ou trois semaines avant la semaine 
d’enquéte, pour qu’on y ait le temps d’imprimer les formules 
d’enquéte et d’envoyer leur tache aux intervieweurs. Pour ce 
qui est des logements qui participent a l’enquéte pour la 
premiere fois, il s’agit des données de contréle seulement, 
provenant des listes de grappe. Pour les cing sixiemes de 
l'échantillon qui participaient a l’enquéte le mois précédent, on 
inclut egalement certaines données tirees du dossier du 
menage et du questionnaire. On se sert de cette information 
pour imprimer les formules d’enquéte pour le mois en cours 
(FO3, F04, FO5, et FO6 s'il y a lieu). 


In large cities, where listing information is 
adequate, postal addresses are taken from cluster lists 
and used to mail out introductory letters to dwellings 
selected for the first time. Where this is not possible, 
interviewers have a supply of letters which can be used 


to introduce the survey at the first contact with the 
household. 


In the second week prior to Survey week, clerical 
staff in the ROs prepare and ship assignment 
packages to interviewers. Packages include pre-printed 
survey forms, blank survey forms, letters of intro- 
duction, LFS brochures, maps and listings, and control 
and expense claim forms. 


Collection Methodology 


Interviews are conducted Monday to Saturday of 
survey week. An interviewer's assignment will typically 
contain 60 dwellings. First interviews are normally done 
by face-to-face contact at the dwelling; all subsequent 
interviews may be conducted by telephone. To 
minimize the number of times an interviewer must visit 
a dwelling in order to obtain the first interview, a back- 
up procedure using telephones for first contacts has 
been developed. When several visits to a dwelling has 
not resulted in contacting an eligible respondent, 
attempts are made to obtain telephone numbers from 
sources such as city directories and neighbours. 
Dwellings are then telephoned either to arrange for a 
personal visit or to conduct the first interview by 
telephone. During July and August, months when 
temporary absence from dwellings is high, the 
interview period may be extended to Sunday or 
Monday. 


Survey information is obtained directly, if possible, 
from all household members present, although any 
household member 15 years of age or more may be 
interviewed to obtain proxy responses for all other 
household members. 


Household membership consists of all persons 
living in the selected dwelling who have no usual place 
of residence elsewhere. Members of the Armed Forces 
are included in the household listing although they are 
excluded from the survey. Visitors from other countries 
and representatives of foreign governments, as well as 
inmates of institutions, are not included. 


Receipt and Capture 


Interviewers are instructed to return all completed 
survey forms to the ROs daily. Theoretically, all ques- 
tionnaires should have been returned by the Saturday 
of survey week, although in practice this Is not done 
until the Tuesday or Wednesday of the following week. 


The ROs begin to process the received forms on 
the Tuesday of survey week. Clerical staff first perform 
a set of basic edits (for example, they ensure that a 
response code is entered on each FO3 and that there Is 
a completed F05 for each eligible household member). 
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Dans les grandes villes, si les renseignements inscrits sur 
les listes sont adéquats, on se sert des adresses de voirie qui 
s'y trouvent pour envoyer une lettre de présentation aux 
logements échantillonnés pour la premiére fois. Sinon, les 
intervieweurs ont une réserve de lettres qu'ils peuvent utiliser 
pour presenter l'enquéte lors du premier contact avec le 
menage. 


Au cours de la deuxigme semaine précédant la semaine 
d’enquéte, le personnel de bureau aux BR prepare et expédie 
aux intervieweurs les documents de la tache. Ces documents 
comprennent : les formules d’enquéte preimprimees, les for- 
mules d’enquete vierges, les lettres de presentation, les bro- 
chures de |’EPA, les cartes et les listes et enfin les formules 
de controle et de demande de remboursement des frais. 


Méthode de collecte 


Les interviews ont lieu du lundi au samedi de la semaine 
d’enquéte. En general, la tache d’un intervieweur compte 60 
logements. Normalement, la premiere interview est faite en 
personne au logement et les suivantes, par telephone. Pour 
reduire au maximum le nombre de visite effectuees au 
logement en vue d’obtenir la premiere interview et le nombre 
de contacts manqués, on a mis au point une marche a suivre 
selon laquelle on se sert du telephone en vue d’etablir le 
premier contact. Lorsqu’apres un certain nombre de visites au 
logement |’intervieweur n’a pas reussi a prendre contact avec 
un membre admissible du menage, i! doit essayer d’obtenir le 
numero de telephone du menage soit en consultant l’annuaire, 
soit en le demandant a un voisin, et telephoner pour prendre 
rendez-vous pour une interview sur place ou pour effectuer 
directement la premiere interview. Pendant les mois de juillet 
et d’aout, etant donne que le nombre de meéenages tempo- 
rairement absents de leur logement est eleve, les inter- 
vieweurs peuvent prolonger la periode d’interview jusqu’au 
dimanche ou lundi. 


Si c’est possible, les intervieweurs recueillent les donnees 
d’enquéte directement aupres de tous les membres du 
menage presents, mais ils peuvent aussi interviewer n'importe 
quel membre du menage age de 15 ans ou plus et obtenir des 
reponses par procuration au sujet des autres membres du 
menage. 


Les membres d'un menage sont toutes les personnes qui 
habitent un logement echantillonne et n'ont pas di’autre 
domicile habituel. Les membres des forces armees sont inclus 
dans la liste des meénages bien qu'ils soient exclus de 
l‘enquéte. Les éetrangers en visite au Canada et ceux qui 
representent un autre Etat de méme que les pensionnaire d'un 
éetablissement institutionnel sont egalement exclus. 


Réception des formules et saisie des donnees 


Les intervieweurs doivent retourner toutes les formules 
d’enquéte remplies aux BR au jour le jour. En principe, tous 
les questionnaires devraient étre partis quand arrive le samedi 
de la semaine d’enquéte, mais en pratique ils ne le sont pas 
avant le mardi ou le mercredi de la semaine suivante. 


Le dépouillement des formules recues aux BR deébute le 
mardi de la semaine d’enquéte. Le personnel de bureau 
commence par faire une serie de verifications de base (par 
exemple, s'assurer qu'il y a un code de reponse sur chaque 
FO3 et qu'il y a une FOS remplie pour chaque membre 


Edited forms are separated into "births" and “non- 
births" and bundled into batches of approximately 25 
FO3s and their related F04s, FO5s and FO6s. Batches 
are sent to the Computer Operations unit, where the 
information is captured on the minicomputer. 
Transmission of the captured data to Head Office takes 
place nightly, beginning Tuesday of survey week. The 
cut-off for the receipt of questionnaires from 
interviewers is the Wednesday noon after survey week. 
The processing of these questionnaires takes place 
Wednesday afternoon, with the final transmission to 
Ottawa that night. 


Verification of Data Capture 


To monitor and control the quality of data capture, 
prior to the transmission of batches of captured survey 
forms, they are subject to verification on either a 100 
percent basis or a sample basis. Batches of F03s for 
birth households or FO3s that have changes are 
verified by having all forms data-captured a second 
time, matched and reconciled. For other survey forms, 
a sample of documents from each batch are re- 
captured and matched. All identified errors are 
corrected. If the number of errors exceeds a cut-off 
value, the whole batch is re-captured. The amount of 
sample verification varies according to the type of 
survey form and the past performance of the data entry 
operators. 


7.¢ Data Processing 


This section briefly describes the major steps in 
the processing and dissemination of the monthly 
Labour Force Survey data in Head Office. The Labour 
Force Survey data are released each month on the 
second Friday after survey week. In order to meet this 
deadline a very tight schedule is followed in Head 
Office. In fact, the survey cycle begins at the end of 
the previous month’s survey when the information used 
in preprinting the FO3s and FO5s is transmitted to the 
Regional Offices. As detailed earlier, the forms are 
preprinted, the interviewer's assignments sent out, and, 
in survey week, the interviewing takes place. By 
Wednesday of survey week transmission of the data to 
Head Office for processing begins. The file used to 
receive the transmitted data, called the structure and 
response file, contains the F03 data for each household 
and the FOS data for each member of the household. 
As the data are received they are edited and coded. 
By Wednesday of the week following survey week, all 
the survey data has been received from the Regional 
Offices and by Friday of that same week a file is ready 
for weighting. The weighted file is used to produce the 
tabulations for the monthly press release and publica- 
tion. 
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admissible du ménage). Les formules vérifiees sont ensuite 
séparées selon qu’elles se rapportent a de nouveaux ou a 
d’anciens ménages et mises en lots d’environ 25 F03 
accompagneées des F04, F05 et F06 correspondantes. Les lots 
sont envoyés a la Sous-section des travaux informatiques ou 
les données sont introduites dans le mini-ordinateur. La trans- 
mission au bureau central des données saisies se fait chaque 
nuit a partir du mardi de la semaine d’enquéte. La date limite 
pour la réception des questionnaires envoyes par les inter- 
vieweurs est le mercredi midi suivant la semaine d’enquéte. 
Le dépouillement de ces questionnaires a lieu le mercredi 
aprés-midi et la derniere transmission des données a Ottawa, 
dans la nuit qui suit. 


Vérification de la saisie des données 


Pour surveiller et controler la qualité de la saisie des 
données, apres cette opération, on soumet les lots de 
formules a une verification intégrale ou par echantillon. Dans 
le cas des FO3 se rapportant a de nouveaux meénages ou 
ayant subi certains changements, on en prend des lots 
complets et on saisit toutes les données-une seconde fois, 
apres quoi on compare les resultats obtenus avec les 
premiers. Dans le cas des autres formules d’enquéte, on en 
prend un échantillon, on saisit les donnees de nouveaux et on 
fait la Comparaison. Toutes les erreurs relevees sont corri- 
gées. Si le nombre d’erreurs dépasse un certain seuil, le lot 
complet est soumis a la saisie de nouveau. La taille de 
’6chantillon soumis a la verification varie selon le genre de 
formule et le rendement passé des préposés a |'introduction 
des données. 


7.7 Traitement des données 


Dans cette section, nous allons décrire brievement les 
principales etapes du traitement et de la diffusion des 
données mensuelles de l’enquéte sur la population active au 
bureau central. Les données tirees de |’enquéte sur la 
population active sont diffusees chaque mois le deuxieme 
vendredi suivant la semaine d’enquete. Pour arriver a res- 
pecter cette echeance, il faut suivre un calendrier tres serre au 
bureau central. De fait, le cycle de l’enquéte commence a la 
fin de l’enquéte du mois précédent avec la transmission aux 
BR des données nécessaires a la preimpression des FO3 et 
des FO5. Comme nous l’avons vu plus haut, les formules sont 
préimprimees, la tache des intervieweurs est expediée puis 
les interviews ont lieu (pendant la semaine d’enquéte). La 
transmission des données au bureau central en vue de leur 
traitement débute le mercredi de la semaine d’enquéte. Le 
fichier dans lequel sont versees les données recues, qu'on 
appelle le fichier structure des réponses, contient les données 
sur chaque ménage provenant de la formule FO3 et les 
données sur chaque membre des ménages provenant de la 
formule FO5. Les données sont verifiges et codées au fur et 
a mesure quelles arrivent. Le mercredi de la semaine suivant 
la semaine d’enquéte, toutes les données d’enquéte ont été 
recues des bureaux régionaux et le vendredi, le fichier est prét 
pour la ponderation. On se sert du fichier pondéré pour faire 
les totalisations qui seront reproduites dans la publication et le 
communiqué mensuels. 


Editing and Coding 


Producing a file for weighting from the structure 
and response file involves five processing steps, each 
one using a Combination of computerized and manual 
procedures. These are Record Acceptance, Notes 
Coding, Industry/Occupation Coding, Detail Edits and 
Demographic Edits. Before going through these steps, 
the FO3 and FOS data are reformatted onto the 
consolidated file. Each record on this file contains the 
FOS data for the respondent, plus the F03 data for the 
household containing the respondent. 


Record Acceptance 


The function of this process is to ensure FO5 
information exists for each eligible person aged 15 and 
over in the household. Conversely, it also ensures that 
anyone who should not have any F05 data in fact does 
not (i.e., respondents under 15 years and military 
personnel). If a record fails either of these checks, it is 
output for correction by a member of the processing 
staff. After examining the information given for the 
record in error and the responses of the other 
household members, action is taken to correct the 
error. For example, if a respondent 15 years and over 
has no FOS data and the rest of the household data 
indicates that the person should have an FO5, the data 
will be imputed using the FO5 data of a respondent in 
the previous month’s survey who has similar demo- 
graphic data from the same geographic area. If, on the 
other hand, the rest of the household data indicates the 
person is no longer a member of the household, the 
data on this person will be deleted from the file. 


Notes Coding 


In this process the notes for certain key questions 
entered by the interviewer are examined by the 
processing staff when the reponse to the question |s 
"Other". If a response other than “Other” should have 
been entered the response will be changed; otherwise 
it will remain as is. 


Industry/Occupation Coding 


In this process, industry and occupation codes are 
assigned using the respondent's job description on the 
FO5. In order to decrease the volume of coding each 
month, only new respondents to the survey, OF 
respondents whose job description has changed since 
the previous month go through the industry occupation 
coding procedures. If the job description Is unchanged 
from the previous month, the codes from the last 
month are simply brought forward onto the current 
month's data automatically. 


For records that do require industry occupation 
coding, the first step is to attempt to code the record 
with a computerized procedure. If this !s unsuccessful, 
the record will be output for manual coding. 


Pe 


Verification et codage 


Pour produire un fichier en vue de la pondeération a partir 
du fichier structuré des réponses, il faut suivre cing étapes 
comprenant des operations informatiques et des operations 
manuelles : l’acceptation des dossiers, le codage des notes, le 
codage de la branche d’activité et de la profession, la veri- 
fication des détails et la verification des donnees démo- 
graphiques. Avant le commencement de ces operations, les 
données tirées des formules F03 et FO05 sont combinées et 
versees dans le fichier integré. Chaque enregistrement dans 
ce fichier contient les données sur le répondant provenant de 
la formule FO5 et celles, provenant de la formule FO3, sur le 
menage dont fait partie le repondant. 


Acceptation des dossiers 


L'objet de cette étape est de s’assurer qu'on dispose bien 
de donnees tirees de la formule FO5 sur chaque personne 
admissible dans le menage agee de 15 ans et plus et, 
inversement, qu’aucune donnée au sujet des personnes 
inadmissible est presente (c’est-a-dire sur les personnes 
agees de moins de 15 ans et sur le personnel militaire). Si un 
enregistrement est rejete a une de ces deux verifications, il 
est imprime afin qu'un prépose au traitement y apporte les 
corrections necessaires. Le prepose examine les renseigne- 
ments que contient l’enregistrement errone et les réponses 
fournies par les autres membres du menage, puis |! prend une 
mesure corrective. Si, par exemple, il n'y a pas de données 
provenant d'une formule FOS sur un repondant age de 15 ans 
ou plus et que les données sur le menage indiquent qu'il 
devrait y en avoir, on comble cette lacune par imputation, 
c'est-a-dire en prenant des donnees tirees d’une formule FO5 
sur un répondant qui a participe a l’enquete le mois pre- 
cédent, dont les caracteristiques demographiques sont sem- 
blables et qui demeure dans la meme region. Si, au contraire, 
on a des données sur une personne qui, selon les donnees 
sur le menage, ne fait plus partie de celui-ci, on les supprime 
dans le fichier. 


Codage des notes 


Cette étape consiste, pour le personnel charge du traite- 
ment des données, a examiner le contenu des notes, c’est-a- 
dire de la section ou l’intervieweur a inscrit des observations 
vis-a-vis de questions importantes auxquelles la reponse est 
"autre". S'il avait fallu choisir une reponse differente, on la 
change, sinon on la laisse telle quelle. 


Codage de la branche d’activite et de la profession 


Cette etape consiste a coder la branche d’activite et la 
profession en fonction de la description du travail effectue par 
le repondant que celui-ci a fournie et qui est inscrite sur la 
formule 05. Pour réduire le nombre de réponses a coder 
chaque mois, on ne procede au codage de la branche 
d'activite et de la profession que dans le cas des nouveaux 
repondants ou des repondants dont la reponse a change par 
rapport au mois precedent. Si la reponse n'a pas change, on 
se contente de rappeler le code du mois precedent et de 
l'insérer automatiquement dans les données du mois en 
cours. 


En ce qui concerne les enregistrements qui doivent étre 
codés, on commence par essayer une procedure automa- 
tique. Si elle ne fonctionne pas, |’enregistrement est imprime 
et on procede au codage a la main. 


The automatic coding system uses a library of 
previous coded descriptions. Initially, an attempt is 
made to match the description requiring coding to this 
library of coded descriptions. This saves time so that 
frequently occurring descriptions do not need to be 
coded in the more complicated second phase of the 
automatic coding. This second phase is based on the 
Hellerman Algorithm developed at the U.S. Bureau of 
the Census (Hellerman, 1981). This algorithm will 
assign a code to a description using a matching coded 
description. If no match is available, it will assign the 
code using a description similar to that being coded. A 
similar description would be one that differs from the 
description being coded by only one or two words. 


If the automatic coding system is not successful in 
assigning the industry and occupation codes, the 
record will be output to be coded manually. The 
automatic system is designed to allow the partial 
coding of the job description. Therefore, a record 
output for manual coding may only need to be 
assigned an industry code or an occupation code. The 
Standard Industrial Classifications and Standard Occu- 
pation Classifications manuals are used in manual 
coding. 


Once the industry and occupation codes have 
been assigned, a logic check is done to ensure that the 
combination of industry, occupation and class of work 
codes "make sense". If the codes that were assigned 
to the job description are illogical, the record will be 
output for coding again. 


Detail Edits 


This is the edit and imputation process for the 
labour force information on the FO5. Here, validity and 
logic errors are detected and corrected. Generally, any 
invalid or illogical responses are automatically cor- 
rected either deterministically, using the previous 
month's data, or by "cold-deck" imputation. Deter- 
ministic corrections are those in which the correct 
response can be determined by the responses to other 
questions on the form. The previous month’s response 
to a question in error in the current month is used to 
correct the current month’s data if the responses to the 
other questions are the same in both months. 


In cold-deck imputation, the response given the 
previous month on another record in the same 
geographic area and with similar characteristics as the 
record in error is used in place of the response to the 
question in error. If neither of these two methods can 
be used to correct this error, the record is printed and 
corrected manually. The processing staff have instruc- 
tions on how to correct the error either by looking at 
the responses given this month or the previous month, 
or by imputing a correct answer from a record with 
similar characteristics in the previous month’s data 
stored on micro fiche. 


Ti 


Le systeme de codage automatique fait appel a une 
reserve de descriptions déja codees. Il commence par com- 
parer la description devant etre codée a des descriptions 
souvent données utilisées et précodées. Cette etape vise a 
faire gagner du temps en evitant que les descriptions cou- 
rantes ne soient pas soumises a la deuxieme etape du codage 
automatique, qui est plus compliquée. Cette deuxieme etape 
est basée sur l’algorithme de Hellerman, mis au point au U.S. 
Bureau of the Census. Cet algorithme permet non seulement 
d’attribuer un code a une description en trouvant une 
description pareille déja codée, mais aussi, si on ne trouve 
pas de description pareille, de prendre le code d’une descrip- 
tion semblable. Une description semblable en est une qui 
differe de la description a coder par un ou deux mots. 


Si le systeme de codage automatique ne reussit pas a 
attribuer un code de branche d’activité ou de profession, 
l’enregistrement est imprime et subit alors un codage manuel. 
Le systeme automatique peut faire un codage partiel a partir 
de la description du travail effectue, de sorte qu’il peut ne 
manquer a un enregistrement rejete du systeme que l'un ou 
l'autre des codes, c’est-a-dire soit celui de la branche 
d’activité, soit celui de la profession. Les ouvrages de refé- 
rence pour le codage manuel sont la Classification type des 
industries et la Classification type des professions. 


Une fois que le code de branche d’activité et le code de 
profession ont été attribués, on fait un controle de coherence 
pour s’assurer que les codes de branche diactivite, de 
profession et de categorie de travailleur vont bien ensemble. 
Si les codes attribués en fonction de la description du travail 
effectue ne sont pas plausibles, l’enregistrement est imprime 
en vue d’étre recode. 


Vérification des détails 


ll s’agit du processus de controle et d'imputation 
applique aux données relatives a |’activité tirees de la formule 
FO5. C’est a cette étape que les données non valides et les 
erreurs de logique sont corrigees. Dans la plupart des cas, les 
reponses non valides et illogiques sont corrigées automatique- 
ment soit de maniere déterministe, soit d’aprés les réponses 
données le mois precedent, soit par la méthode d’imputation 
dite du "cold deck". La méthode déterministe est celle qui 
consiste a déterminer la bonne réponse d’aprés les réponses 
données aux autres questions sur la méme formule. La 
deuxieme méthode consiste a aller chercher dans |’enregis- 
trement du mois precedent la réponse qui permettra de 
corriger la reponse erronee dans |’enregistrement du mois en 
cours, a condition que les réponses aux autres questions 
soient les memes dans les enregistrements des deux mois. 


Enfin, selon la méthode du "cold deck", on remplace la 
reponse erronée par la reponse donnée le mois précédent par 
une personne de la meme région ayant des caractéristiques 
semblables. Si toutes ces methodes échouent, |’enregistre- 
ment est imprime et corrige a la main. Le personnel chargé 
du traitement des données a des directives sur la facon de 
corriger lerreur soit en consultant les autres reponses 
donnees le méme mois ou le mois précédent, soit en allant 
chercher dans les microfiches la reponse donnée le mois der- 
nier par une personne ayant des caractéristiques semblables. 


Demographic Edits 


In this process the demographic data reported on 
the F03 for each household member are edited in three 
stages. First, staff ensure that all the responses are 
valid (i.e., none are out of range or blank), second, they 
check that the responses are logical at the respondent 
level and third, they make sure the demographic 
responses are logical at the household level. An 
example of a logic error at the individual level would be 
if the spouse had a marital status of single rather than 
married. A logic error at the household level would be 
if there were two spouses in one family. Any errors are 
printed for manual correction by the processing staff 
who have instructions on the various methods of 
correction, depending on the type of error. 


Weighing 


When the demographic characteristics have been 
verified, the consolidated file of FO3 data for each 
household and the FO5 data for each member of the 
household are ready to be weighted. In this phase, 
each file is weighted to indicate the number of persons 
represented by each individual in the sample, thereby 
creating a weighted file for purposes of data 
compilation. See Chapter 8 for details. 


Concepts and Compilation 


The Labour Force Survey is aimed at providing 
data on persons of working age. The data is divided 
into three categories: the employed, the unemployed 
and persons not in the labour force. A correspondence 
between the responses of each person in the sample 
and the concepts represented by the categories can 
be established according to a set of decision rules. 
When this phase is complete, the cumulative weights 
of all the files having the characteristics in question 
yield detailed estimates on the labour market. 


7.8 Dissemination of Data 


Statistics from the LFS reflect the state of the 
labour market at a specific time, namely, the week 
containing the 15th day of the month. This week Is 
known as the reference week. During the third week 
after the reference week (usually the first full week of 
the next month), the estimates are analysed and the 
main tables are prepared for the production of the 
publication Labour Force Information (catalogue no. 
71-001P), which is available to the public at 7 a.m. on 
the Friday. The complete list of all the tables published 
regularly in The Labour Force (catalogue no. 71-001) is 
available ten days later. 


Publications 


To ensure the rapid dissemination of the most 
recent labour market statistics, only a short commen- 
tary is given in Labour Force Information (71-001P). 
This commentary consists of a concise analysis of data 
from the current survey, the main seasonally adjusted 
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Verification des données démographiques 


Les données démographiques se rapportant a chaque 
membre du ménage qui sont inscrites dans la formule FO3 
sont contrdlées en trois étapes. Premiérement., il faut s'assurer 
que toutes les reponses sont valides (c’est-a-dire qu’aucune 
n'est en blanc ni en dehors de la fourchette de valeurs 
acceptables), deuxiemement, il faut s’assurer qu’elles sont 
coherentes au niveau du répondant et, troisiemement, il faut 
s'assurer qu’elles sont cohérentes au niveau du ménage. Un 
exemple d’erreur de logique au niveau du repondant serait le 
cas d'un conjoint dont |l’état matrimonial serait "célibataire" au 
lieu de "marie". Un exemple au niveau du ménage serait une 
famille ou il y aurait deux conjoints. Aussitét que le personnel 
charge du traitement releve une erreur, il imprime |'enre- 
gistrement pour prendre les mesures correctives nécessaires 
selon le genre d’erreur en cause. 


Ponderation 


Lorsque la verification des caracteristiques est complétée, 
le fichier consolidé des renseignements des dossiers des 
menages (F03) et des individus (FO5) est pret pour la 
ponderation. Cette étage consiste a attribuer a chaque dossier 
un poids qui designe le nombre de personnes que represente 
chaque individu faisant partie de |’echantillon. Au terme de ce 
procede, un fichier pondeére sera cree pour fins de compilation 
des données. Voir le prochain chapitre pour les details. 


Concepts et compilation 


L'enquéte sur la population active vise a fournir des 
données pour la population d’age actif qui est divisée en trois 
categories: les personnes occupées, les chdmeurs et les 
inactifs. Un ensemble de regles de decisions permet d’établir 
la correspondance entre les reponses fournies par chaque 
personne faisant partie de |l’echantillon et les concepts qui 
definissent ces trois categories. Ce processus termine, il est 
possible de produire des estimations detaillees sur le marche 
de travail en cumulant les poids de tous les dossiers qui 
possedent des caracteristiques données. 


7.8 Diffusion des donnees 


Les statistiques de l’enquéte sur la population active 
referent a l'état du marche du travail a un moment precis dans 
le temps, soit la semaine comprenant le 15 du mois, I.e., la 
semaine de reference. La troisieme semaine suivant la se- 
maine de reference (habituellement la premiere semaine com- 
plete du mois suivant) les estimations sont analysees et les 
tableaux principaux sont prepares afin de produire la publi- 
cation /nformation population active (71-001P au catalogue) 
qui est disponible au public dés 7h00 le vendredi. Le 
catalogue complet des tableaux regulierement publies dans La 
population active (71-001 au catalogue) est disponible dix 
jours plus tard. 


Publications 


Afin de permettre la diffusion rapide des plus réecentes 
statistiques sur l'état du marche du travail, la publication 
Information population active (71-001P) ne contient qu'un 
commentaire, qui analyse brievement les données courantes 
de l’'enquéte, les principales estimations desaisonnalisées et 


and unadjusted estimates for Canada and_ the 
provinces, as well as unadjusted estimates for metro- 
politan areas and economic regions. From May to 
September, data on student activities is included in the 
publication. 


All these data are provided in The Labour Force 
(71-001), a monthly publication incorporating more 
than 40 statistical tables giving details of the 
population's characteristics according to such variables 
as sex, marital status, age, level of schooling, school 
attendance, industry and occupation, class of worker, 
number of hours worked, reasons for part-time 
employment, duration of unemployment, type of work 
sought, reasons for leaving last job, family status and 
reasons for not looking for work. The December issues 
of The Labour Force contain the annual averages of 
all the monthly tables. 


Users of labour force statistics have access to 
more than 6,000 historical data series in the CANSIM 
database. These series are updated monthly and are 
available the day the latest data are released. 


Special Compilations 


Users requiring more detailed statistics than those 
available in the publications described above can 
contact the Information and Current Analysis Section 
of the Labour Force Survey Sub-division, which 
provides various services in return for the cost of 
producing special compilations. 


Microdata Tape 


Users who wish to produce their own tables, 
manipulate data and conduct statistical experiments 
can obtain a microdata tape of the LFS. The 56 survey 
variables on the tape are selected to ensure the data 
supplied by respondents remain confidential. 
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non désaisonnalisées pour le Canada et les provinces, ainsi 
que les estimations non désaisonnalisées pour les regions 
métropolitaines et les regions économiques. Pour les mois de 
mai a septembre inclusivement, les données sur l’activite des 
étudiants sont ajoutées a cette publication. 


Toutes ces informations sont reproduites dans le cata- 
loque mensuel La population active (71-001) qui contient 40 
tableaux de statistiques deétaillant les caracteristiques de la 
population selon diverses variables telles: le sexe, |’éetat 
matrimonial, l’age, le niveau de scolarité, la frequentation 
scolaire, la branche d’activité, la profession, la categorie de 
travailleurs, le nombre d’heures travaillees, les raisons don- 
nees pour l’emploi a temps partiel, la durée du chomage, le 
genre d’emploi recherche, les raisons données pour avoir 
quitté le dernier emploi, la situation des familles, les raisons 
pour ne pas avoir cherche d’emploi. Enfin, les numeros de 
décembre de La population active contiennent les moyennes 
annuelles pour tous les tableaux publiés mensuellement. 


De plus, par l’intermédiaire des bases de données de 
CANSIM, les utilisateurs de statistiques sur la population 
active ont acces a plus de 6000 series chronologiques qui 
sont mises a jour mensuellement et sont disponibles des le 
jour de diffusion des données les plus récentes. 


Compilations spéciales 


Pour les usagers qui ont besoin de statistiques encore 
plus détaillées que celles qui sont disponibles dans les publi- 
cations décrites ci-haut, la section d'information et d’analyse 
courante de |’Enquéte sur la population active offre divers 
services, moyennant le recouvrement des frais pour la 
production de compilations spéciales. 


Bandes de micro-données 


Les usagers qui désirent créer eux-méme leurs propres 
tableaux speciaux, manipuler les données et faire des expe- 
riences statistiques, peuvent se procurer une bande de micro- 
données de l’enquéte. Les 56 variables sur cette bande 
regroupent les données de facon a assurer la confidentialité 
des informations fournis par les enquéte-e-s. 


Chapter 8 


Weighting and Estimation 


8.1. Introduction 


The principle behind the estimation procedure in a 
probability survey such as the Labour Force Survey is 
that each person in the sample "represents" not only 
himself or herself, but several persons not in the 
sample as well. For example, in a simple random 
sample of 2 percent of a population, each person in the 
sample represents 50 people in the population, since 
one person out of fifty was selected at random. Given 
the sample data in the form of records, one way to 
produce estimates for the population would be to 
duplicate each record so that there are 50 copies of 
each one, and then to compile any aggregates and 
cross-classifications of interest for this "pseudo- 
population". If the 2 percent sample is truly represen- 
tative of the real population, then the numbers, i.e., 
estimates, obtained by this procedure will be close to 
the values one would obtain if the records for the real 
population were available. 


In a probability sample, the sample design itself 
determines weights that may be used to produce 
unbiased estimates. Each person's record may be 
weighted by the inverse of the probability of selecting 
that person in the sample. Thus, in the above 
example, instead of creating a pseudo-population file of 
duplicate records, one can simply attach a weight of 
1/0.02, or 50, to each sampled person’s responses to 
produce simple estimates. 


For the LFS, the file created for tabulation contains 
one record per person in the sample. Each record 
contains labour force and demographic characteristics 
for the respondent. Instead of physically duplicating 
the sample records, a weight is entered on each 
record. This weight can be thought of as the number 
of times the record should be duplicated. If a 
characteristic is to be estimated, then an estimate can 
be obtained as the sum of the weights of all persons in 
the sample with that characteristic. For example, if the 
characteristic of interest is the number of persons 
employed in manufacturing, then an estimate of this 
can be obtained by summing the weights on the 
records of all persons employed in manufacturing. 


Frequently, objective information on relevant 
characteristics for the population is available from 
sources other than the survey itself. Several estimation 
methods exist that use such auxiliary information to 
increase the reliability of estimates. In the past. the 
LFS has used ratio estimation and raking ratio estima 
tion to increase reliability. But these methods yield a 
different final weight for individuals in the same 
household, resulting in inconsistent estimates for 
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Pondeération et estimation 


8.1. Introduction 


Le principe sur lequel repose la méthode d’estimation uti- 
lisee dans une enquéte a échantillonnage probabiliste, comme 
l‘enquéte sur la population active, est que chaque personne 
dans l’échantillon "représente" non seulement elle-méme, 
mais aussi plusieurs personnes qui ne sont pas échantillon- 
nees. Par exemple, dans un échantillon aléatoire simple de 
2% de la population, chaque personne dans |’échantillon 
represente 50 personnes dans la population, puisqu’on a 
choisi au hasard une personne sur cinquante. Comme les 
données de |’enquéte sont inscrites dans un enregistrement, 
on pourrait, pour produire des estimations relative a la 
population entiere, faire cinquante copies de chaque enre- 
gistrement puis calculer les totaux et faire les recoupements 
qui nous interessent relativement a cette pseudo-population. 
Si l'echantillon de 2% est vraiment représentatif de la popu- 
lation réelle, les nombres, c’est-a-dire les estimations, obtenus 
de cette maniere seront voisins des valeurs qu'on obtiendrait 
sion avait des enregistrements sur toute la population. 


Dans un echantillon probabiliste, c’est le plan de sondage 
qui determine les poids a utiliser pour produire des estima- 
tions non biaisées. On peut notamment attribuer a l’enregis- 
trement se rapportant a chaque personne un poids qui est 
"inverse de la probabilite de selection de cette personne. 
Ainsi, dans l'exemple qui precede, au lieu de creer un fichier 
sur une pseudo-population qui serait constitue des enre- 
gistrements copies cinquante fois chacun, on pourrait simple- 
ment rattacher aux réeponses de chaque personne eéchantil- 
lonnée un poids de 1/0.02 ou de 50 et produire de la sorte des 
estimations simples. 


Dans |’EPA, le fichier créé aux fins de la totalisation des 
donnees compte un enregistrement par personne echantil- 
lonnée. Chaque enregistrement contient des données sur les 
caractéristiques du repondant du point de vue demographique 
et du point de vue de l'activite. Au lieu de copier les enre- 
gistrements, on y inscrit un poids. Ce poids represente le 
nombre de fois que |’enregistrement devrait etre copie. Si on 
veut produire une estimation relativement a une carac- 
teristique, on peut le faire en additionnant le poids de toutes 
les personnes dans |’éechantillon qui ont cette caracteristique. 
Si la caractéristique qui nous interesse est le nombre de 
personnes qui ont un emploi dans le secteur manufacturier, on 
peut en obtenir une estimation en additionnant le poids 
attribué a toutes les personnes travaillant dans ce secteur. 


ll arrive souvent qu’on ait acces a des données objectives 
sur des caractéristiques pertinentes de la population par 
d'autres sources que l’enquéte. Plusieurs methodes d’estima- 
tion se servent de telles données auxiliaires pour augmenter la 
fiabiliteé des estimations. Par le passé, on a eu recours a 
l'estimation par le quotient et a l’estimation iterative du 
quotient pour augmenter la fiabilite des donnees de |’EPA. 
Toutefois, on n’obtient pas par ces methodes un poids final 
pareil pour tous les membres d'un méme ménage, de sorte 


individuals and families. To ensure that all household 
members have the same final weight, the LFS now 
uses a method based on a linear regression approach. 
Like the previous methods, the current one uses 
census projections for the sizes of various age-sex 
groups, economic regions and major cities as auxiliary 
variables. Because of its flexibility, the current method 
uses a greater number of such variables than before. 


In the LFS, the final weight attached to each 
record (i.e., individual) is derived in six steps. The first 
five steps are used to calculate a subweight, which is 
the product of five factors: the basic weight, the rural- 
urban factor, a balancing factor for nonresponse, the 
cluster subweight and the sample stabilization factor. 
The sixth and final step transforms the subweight into a 
final weight using the regression-based method 
mentioned in the previous paragraph. Each of these 
steps is described in more detail in the following 
sections. 


8.2 The Basic Weight 


The basic weight is determined by the sample 
design of the survey. It is simply the inverse of the 
sampling ratio. Thus, using the example given in the 
introduction to this chapter, a 2 percent sample would 
have a basic weight of 1/0.02, or 50. The sampling ratio 
is discussed in Chapter 2. 


The basic weight differs among economic regions. 
Within an economic region it is the same for all Non- 
Self Representing strata but varies among Self 
Representing strata. 


8.3. Rural-Urban Factor 


NSR areas contain rural and urban parts.  Infor- 
mation concerning the total population in rural and 
urban areas is available from the 1981 Census for each 
Primary Sampling Unit, including those that are not in 
the sample. Using the sampled PSUs only, a simple 
estimate of the 1981 rural and urban populations in 
each province can be obtained by dividing each 
sampled PSU’s 1981 rural and urban populations by 
the PSU’s known probability of selection and summing 
to the Economic Region level. These Economic Region 
estimates of the urban and rural populations are then 
compared with the actual urban and rural populations 
to judge if the sample is representative. The ratio of 
actual rural population to estimated rural population is 
called a rural factor, and an urban factor is defined 
similarly. These two factors are computed when the 
PSUs are selected, and are entered on each sample 
record in the NSR areas. Changes in these factors are 
incorporated at the time of PSU rotation. 
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que les estimations relatives aux particuliers et celles relatives 
aux familles ne sont pas cohérentes. Pour s’assurer que tous 
les membres d’un ménage ont le méme poids final, on utilise 
a présent une méthode fondée sur la régression linéaire. 
Comme les méthodes utilisées antérieurement, celle-ci se sert 
de projections du recensement concernant la taille de divers 
groupes d’age-sexe, les régions économiques et les grandes 
villes en tant que variables auxiliaires. La methode actuelle 
étant plus souple, elle a recours a un plus grand nombre de 
variables de ce genre que |’ancienne. 


Dans I'EPA, on calcule en six etapes le poids final attri- 
bué a chaque enregistrement (et donc a chaque personne). 
Les cing premiéres étapes permettent de calculer un sous- 
poids, qui est le produit de cing facteurs : le poids de base, le 
facteur rural-urbain, le facteur de compensation pour la non- 
réponse, le sous-poids de grappe et le facteur de stabilisation 
de l’échantillon. 


8.2 Poids de base 


Le poids de base est détermine par le plan de sondage 
de l’enquéte. C’est simplement l’inverse de la fraction de 
sondage. Si l'on reprend donc l’exemple donne au début de 
ce chapitre, pour un échantillon de 2% de la population, le 
poids de base serait de 1/0.02 ou 50. La fraction de sondage 
est traitee au chapitre 2. 


Le poids de base varie selon la region economique. Dans 
une région économique, il est le méme pour toutes les strates 
NAR mais varie selon la strate AR. 


8.3 Facteur rural-urbain 


Les secteurs NAR contiennent des parties rurales et des 
parties urbaines. On connait la population totale des régions 
rurales et urbaines de chaque UPE par les chiffres du 
recensement de 1981, y compris celle des régions qui ne sont 
pas dans |’échantillon. En se servant seulement des chiffres 
sur la population des UPE échantillonnees, on peut obtenir 
une estimation simple de la population rurale et urbaine de 
chaque province selon les chiffres de 1981 en divisant la 
population rurale et urbaine de chaque UPE échantillonnée 
par la probabilité de sélection connue de |’UPE et en addi- 
tionnant les résultats obtenus jusqu’au niveau de la région 
économique. On compare alors ces estimations de la popu- 
lation rurale et urbaine des RE aux chiffres reels sur ces 
populations afin de déterminer si |’échantillon est représentatif. 
Le rapport entre la population rurale reelle et la population 
rurale estimée s’appelle le facteur rural. Le facteur urbain est 
defini de la méme facon. Ces deux facteurs sont calculés 
lorsque les UPE sont échantillonnées et inscrites dans chaque 
enregistrement de |l’echantillon des secteurs NAR. Si ces 
facteurs sont modifiés, le changement est intégré au moment 
du renouvellement des UPE. 


8.4 Treatment of Non Response 


Some nonresponse is virtually certain to occur in 
any large survey. Although each interviewer is 
assigned a completely specified set of households in 
the LFS, and the interviewer makes every effort to 
interview these households, nonresponse will still occur 
for a variety of reasons, such as "no one at home" and 
"refusal to answer questions". The interviewer records 
the reason for each nonresponding household and the 
results are monitored on an Ongoing basis. Non 
response is also discussed in Chapters 7 and 9. 


If a nonresponding household in the current month 
was a respondent in the previous month, then the 
previous data are copied to the current month with 
suitable transformations being applied to certain fields. 
For estimation purposes, these households are treated 
like responding households. This imputation procedure 
is only used for one month; i.e., if a household is a 
respondent one month and a nonrespondent in the 
next two months, then the data are not used in the 
second nonresponse month. 


If the above procedure cannot be used to handle 
nonresponse, then a weight adjustment, called a 
balancing factor is used. Balancing is carried out 
within each balancing unit. In SR areas, each subunit 
is a balancing unit. In NSR areas, each sampled PSU 
is divided into an urban and a rural balancing unit. For 
each balancing unit, the balancing factor is calculated 
as the number of households that should have been 
interviewed divided by the number actually interviewed 
(including those that received last month's data). This 
factor is entered on each sampled record in the 
balancing unit. 


The use of balancing units in estimation assumes 
that the households that have been interviewed 
represent the non responding households; 1.e., 
respondents and nonrespondents are assumed to have 
similar characteristics of interest, such as unemploy- 
ment rate. If this assumption is not valid, then the 
estimates will be biased, and the bias will increase with 
a higher rate of nonresponse. Because the exact 
magnitude of this bias is impossible to calculate, every 
effort is made to reduce nonresponse in the field. 


An unusually high nonresponse rate in a balancing 
unit can result in an unacceptably high balancing 
factor. To avoid this, the balancing unit is collapsed 
with a neighbouring unit whenever the balancing factor 
exceeds 3, and a new balancing factor is then 
calculated for the combined units. 
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8.4 Traitement de la non-réponse 


Bien que, dans |’EPA, on attribue a chaque intervieweur 
un nombre precis de ménages a interviewer et que les inter- 
vieweurs fassent leur possible pour interviewer tous les ména- 
ges, il y a immanquablement des cas de non-réponse. Les 
raisons varient : certaines personnes sont absentes de chez 
elles et d'autres refusent de répondre. Les intervieweur notent 
la raison pour laquelle un menage n'a pas fourni de reponses, 
et le suivi est effectue en conséquence. La non-réponse est 
egalement traitee aux chapitres 7 et 9. 


Si un ménage ne fournit pas de réponses pendant le mois 
en cours alors qu'il en avait fourni pout le mois precedent, les 
données du mois en cours sont obtenues a partir des données 
historique (mois précédent) apres que les corrections né- 
cessaires soient apportees a certaines zones. Aux fins de 
l'estimation, ces ménages sont traites comme des menages 
repondants. On n’applique cette méthode d'imputation que 
pour un mois. Autrement dit, si un menage fournit des 
reponses un mois mais pas les deux mois suivants, on ne 
reprend pas les donnees pour le deuxieme mois de non- 
reponse. 


Si on ne peut pas avoir recours a cette methode pour 
regler le probleme de la non-réponse, on modifie le poids au 
moyen d'un facteur qu'on appelle facteur de compensation. 
La compensation est effectueée dans chaque unite de com- 
pensation. Dans les secteurs AR, chaque sous-unite est une 
unite de compensation. Dans les secteurs NAR, chaque UPE 
échantillonnee est divisee en une unite de compensation 
rurale et une unite de compensation urbaine. Pour chaque 
unité de compensation, on calcule le facteur de compensation 
en divisant le nombre de menages qu'il aurait fallu interviewer 
par le nombre de menages effectivement interviewes (qui 
comprend les menages auxquels on a impute les donnees du 
mois precedent). Ce facteur est inscrit dans chaque enregis- 
trement échantillonné dans |’unite de compensation. 


L'utilisation d’unites de compensation pour |'estimation 
suppose que les ménages interviewes sont représentatifs des 
ménages non répondants, c’est-a-dire qu’on part du principe 
que les menages repondants et les menages non repondants 
sont semblables du point de vue des caracteristiques qui nous 
intéressent, comme le chomage. Si cette hypothese n'est pas 
valable, les estimations sont biaisees et le biais augmente 
proportionnellement au taux de non-réeponse. Comme il est 
impossible de calculer avec exactitude |'ampleur de ce biais, 
on s'efforce de reduire la non-reponse sur le terrain. 


D’un taux de non-réponse exceptionnellement eleve dans 
l'unite de compensation peut resulter un facteur de com- 
pensation si eleve qu'il est inacceptable. Pour eviter cette 
situation, aussit6t que le facteur de compensation d'une unite 
dépasse 3, celle-ci est rattachee a une unite voisine et un 
nouveau facteur de compensation est calculé pour la nouvelle 
unité ainsi formee. 


8.5 Cluster Subweight 


In the LFS, clusters have been designed to yield a 
typical sample take of three to ten households, with the 
lower values in urban areas. Because of rapid 
population growth in a cluster, the actual take may be 
quite different. Substantial growth can be withstood in 
an isolated cluster with a small expected sample 
before the additional take presents a field problem. 
However, if growth takes place in more than one 
cluster in an assignment, subsampling may be needed 
to avoid disruptions in field operations. In this case, 
rather than enumerate all the households that were 
originally selected in a high growth cluster, the inverse 
sampling ratio of the cluster is modified, say to k times 
its original value. As a result, only one out of every k 
originally chosen households is selected. The records 
for these households are then weighted by an 
additional factor k, the cluster subweight, since each of 
these households represents k times as many house- 
holds as was expected by design. 


In addition to their use in the subsampling of 
growth areas, cluster subweights can also be used in 
the SRU Update Program. In this program, cluster 
inverse sampling ratios are recalculated following an 
update to the cluster counts in a subunit. New inverse 
sampling ratios are available immediately, but it can 
take six to ten months before they are introduced into 
the active sample (because of the lead time required to 
introduce clusters). Thus, an interim weighting 
procedure, applied at the subunit level, modifies the 
cluster subweights to adjust for the new expected 
sample from the subunit. In the SRU update procedure, 
a change in weight at the subunit level is accomplished 
by modifying the cluster subweights. In general, any 
weighting adjustments that cannot be applied at other 
levels will be applied as cluster subweights. Thus, the 
use of cluster subweights make the LFS more flexible. 


8.6 Stabilization Factor 


Within each province, stabilization areas, 
consisting of groups of strata, have been formed. For 
each stabilization area, the stabilization factor is cal- 
culated as the ratio of the actual number of households 
in the sample to the expected number of households in 
the sample. If this number is less than one, then the 
stabilization factor is set to one. For further details, 
including the rationale for this factor, see Appendix B. 


8.7 Estimation Methodology 


The subweight is the product of the five factors 
discussed so far. In the final step, auxiliary information 
is used to transform the subweight into the final weight. 
Since January 1989, this has been done using a linear 
regression model, i.e., a model relating a dependent or 
response variable to several independent or explana- 
tory variables. For the Labour Force Survey, the 
dependent variable can be any variable of interest and 
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8.5 Sous-poids de grappe 


Dans |'EPA, les grappes ont été concues de maniere a ce 
qu’elles aient en général un rendement de |l’echantillon de 
trois a dix ménages, les régions urbaines ayant le plus petit 
rendement. Comme la population peut s’accroitre rapidement 
dans une grappe, le rendement réel peut étre tres different du 
rendement prévu. On peut tolérer une assez forte croissance 
avant que celle-ci ne pose de probleme sur le terrain s'il s'agit 
d'une grappe isolée dont le rendement prévu au départ etait 
petit. Toutefois, si la population de plusieurs grappes d'une 
méme tache augmente, il se peut qu’on sous- echantillonne 
ces dernieres pour que les operations sur le terrain ne soient 
pas perturbées. A ce moment-la, au lieu d’interviewer tous les 
ménages choisis initialement dans chacune des grappes a 
croissance élevée, on modifie la fraction de sondage inverse, 
la ramenant a disons k fois sa valeur d’origine. Par conse- 
quent, seulement un des k ménages choisis initialement est 
échantillonné. On introduit dans l’enregistrement de ces 
menages un nouveau facteur de pondeération k, le sous-poids 
de la grappe, puisque chacun de ces ménages repreésente k 
fois plus de meénages que le nombre prevu dans le plan de 
sondage. ; 


Les sous-poids de grappe sont aussi utilises dans le 
cadre du programme de mise a jour des UAR. Dans ce 
programme, on recalcule les fractions de sondage inverses de 
grappe apres la mise a jour du chiffre de population des 
grappes dans une sous-unite. Les nouvelles fractions de 
sondage inverses sont établies immeédiatement, mais il faut 
compter de six a dix mois avant qu’elles ne soient introduites 
dans |’échantillon actif (du au délai d’introduction des 
grappes). On procéede donc a une pondeération provisoire, au 
niveau de la sous-unité, pour modifier les sous-poids de 
grappe en fonction de la taille prévue du nouvel échantillon 
qui sera prélevé dans la sous-unité. Selon la méthode de 
mise a jour des UAR, on change les poids au niveau des 
sous-unites en modifiant les sous-poids de grappe. En 
general, lorsqu’on ne peut pas modifier les poids a un autre 
niveau on le fait au niveau des sous-poids de grappe. 
L'utilisation des sous-poids de grappe ajoute donc a la 
souplesse du plan de |’EPA. 


8.6 Facteur de stabilisation 


On a formé dans chaque province des secteurs de 
stabilisation, qui sont constitues de groupes de strates. Le 
facteur de stabilisation de chaque secteur de stabilisation est 
le ratio du nombre réel au nombre prévu de ménages dans 
l'echantillon. Si ce nombre est inférieur a 1, le facteur de 
stabilisation est fixe a 1. Pour plus de détails au sujet de ce 
facteur, notamment la raison pour laquelle on y a recours, voir 
l’annexe B. 


8.7 Méthode d’estimation 


Le sous-poids est le produit des cing facteurs dont nous 
avons parle jusqu’a present. A la derniére étape, on a recours 
a des informations supplémentaires pour transformer le sous- 
poids en un poids final. Depuis janvier 1989, on le fait en 
utilisant un modele de regression linéaire, c'est-a-dire un 
modeéle qui met en rapport une variable dépendante ou 
variable de reponse et plusieurs variables indépendantes ou 
variables explicatives. Pour l’enquéte sur la population active, 


the independent variables are the auxiliary variables: 
age-sex groups, economic regions, census metropo- 
litan areas. The regression is set up to ensure that the 
final weights it produces sum to the census projections 
for the auxiliary variables. For example, the sum of all 
the final weights for females in the sample who are 
between 30 and 34 years will equal the census 
projection for that age-sex group. It is important to note 
that regression is not used to produce estimates 
directly - it is merely a convenient and flexible tool for 
producing appropriate final weights, which are defined 
implicitly in the regression model. The previous 
method used in the LFS for using auxiliary information 
is discussed at the end of this section. 


Once the final weights are obtained, an estimate 
for an item can be obtained by summing (final 
weight) x (item) for all appropriate sample members. 
For example, if we want to estimate the number of 
women aged 65 and over who are employed, then we 
set item to 1 for individuals who are employed and to 0 
otherwise. We then take the above sum over all women 
in the sample who are at least 65 years old. 


Estimates of ratios, such as the unemployment 
rate, are calculated as ratios of two estimates. For 
example, the provincial unemployment rate for males 
is estimated by the ratio of the estimated number of 
unemployed males to the estimated number of males 
in the labour force. The numerator and denominator 
are calculated as in the previous paragraph. 


Previous LFS Estimation Methodology 


During the period from January 1985 to December 
1988, Labour Force Survey estimates were obtained 
using a raking ratio estimation procedure, which is an 
alternative to the weight adjustment method described 
above. In this procedure, the auxiliary variables used 
for adjustment were the Census projections for the 
population aged 15 years and older in (1) the CMAs, 
(2) the non-CMA portions of economic regions, and (3) 
24 age-sex groups. 


A two iteration procedure was used, with each 
iteration consisting of two steps. 


First, the subweights were adjusted to sum to the 
CMA and non-CMA Economic Region counts. Then, 
the revised weights were adjusted to meet the age-sex 
group projections. These two steps were repeated 
once more to obtain the final weights used in 
estimation and tabulation. 


Variances for the raking ratio estimates were 
obtained using a_ linearization method. This is 
described by G. H. Choudhry and H. Lee (1987). 
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la variable dépendante peut étre n'importe laquelle des 
variables qui nous intéressent et les variables indépendantes 
sont les variables auxiliaires : groupes d’age-sexe, régions 
economiques et régions métropolitaines de recensement. Le 
but de la régression est de faire en sorte que la somme des 
poids finals produits soit égale aux projections du recen- 
sement pour les variables auxiliaires. Par exemple, la somme 
des poids finals pour les femmes dans |'échantillon ayant 
entre 30 et 34 ans sera egale aux projections du recensement 
pour ce groupe d’age-sexe. Il importe de noter qu'on ne se 
sert pas de la regression pour produire des estimations 
directement; c’est plutdt un outil pratique et souple qui permet 
de produire les bons poids finals, lesquels sont definis impli- 
citement dans le modele de régression. La méthode utilisee 
anterieurement pour I'EPA et qui avait recours elle aussi a des 
informations supplementaires est préesentee a la fin de cette 
section. 


Une fois qu'on a obtenu les poids finals, on peut produire 
une estimation relative a une variable en faisant la somme du 
produit (poids final) x (variable) pour tous les membres de 
l'echantillon visés. Ainsi, si l'on veut estimer le nombre de 
femmes agées de 65 ans et plus qui sont occupées, on pose 
la variable egale a 1 pour les personnes occupees et a 0 pour 
celles qui ne le sont pas. On fait ensuite la somme deécrite 
plus haut pour toutes les femmes dans |'echantillon qui ont au 
moins 65 ans. 


Pour calculer les estimations de ratios comme le taux de 
chomage, on fait le ratio de deux estimations. Par exemple, 
pour estimer le taux de chomage provincial chez les hommes, 
on fait le ratio du nombre estime d’hommes en chomage au 
nombre estime d’hommes dans la population active. Le nu- 
merateur et le déenominateur sont calcules comme dans le 
paragraphe precedent. 


Ancienne méthode d’estimation de EPA 


De janvier 1985 a decembre 1988, les estimations de 
l'enquete sur la population active ont ete produites au moyen 
d'une technique d’estimation iterative par le quotient, plutdt 
qu’au moyen de la methode de rajustement des poids deéecrite 
ci-dessus. Selon cette technique, les variables auxiliaires uti- 
lisees pour rajuster les poids etaient les projections du 
recensement relatives a la population agee de 15 ans et plus 
des RMR, des parties des régions economiques autres que 
les RMR et des 24 groupes d’age-sexe. 


La technique d’estimation etait une technique a deux 
iterations, chaque iteration se faisant en deux etapes. 


Premierement, les sous-poids étaient corriges en fonction 
de la somme des chiffres de population pour les RMR et les 
parties des RE autres que les RMR. Ensuite, les poids revises 
étaient corriges pour correspondre aux projections concernant 
les groupes d’age-sexe. Ces deux etapes etaient repetees 
pour obtenir les poids finals utilises dans les estimations et les 
totalisations. 


Pour obtenir la variance des estimations iteratives par le 
quotient, on a eu recours a une methode de linearisation. 
Cette méthode est décrite par G.H. Choudhry et H. Lee 
(1987). 


8.8 Algebraic Description of Weighting 


The basic weight for records in stratum Ah, in 
economic region e, in province p will be denoted by 
W,.,. This weight will be modified by the following 
factors to produce the subweight. 


Let F.,,, denote the rural-urban factor for province p, 
economic region e and type of area j. For self- 
representing areas (j = 1), F,,; = 1. We will now define 
F for non- self-representing areas. 


Let Pig1)penij Genote the 1981 census count of 
persons in province p, economic region e, stratum A, 
primary sampling unit « and type of area j. In non-self 
representing (NSR) areas, the probability m,,,; of 
selecting primary sampling unit (PSU) is proportional to 
its 1981 census population count and is equal to 


P(81)pehi. 
Tpehin “pel =a apa 
P(81)peh.. 


where n,,, iS the number of PSUs selected in peh, and 
a subscript ‘'' denotes summation over an index. 
Then the estimated 1981 population in province p, 
economic region e in type of area j, based on the 
sampled PSUs, is 


P (81 )pehij 


P81 ype..j a Dy: ye aren 


pee Tpehi 
Thus, the rural-urban factor is 


Pri )pe..J 
12: — 


pej 


P (g1)pe..j 


where j = 2 for urban NSR areas and j; = 3 for rural 
NSR areas. 


Normally, the cluster subweight C is equal to 1 
except where subsampling due to growth has taken 
place. However, the cluster subweight is sometimes 
used to account for other changes. See Section 8.5 for 
details. 


The sample stabilization weight S will equal 1 
unless the actual number of dwellings in a stabilization 
area exceeds the expected, or base, number of 
dwellings in the area. In the latter case, S is set equal 
to the ratio of actual to expected dwellings. There is 
one exception: if the stabilization area contains growth 
clusters with cluster subweights different from 1, then 
the sample stabilization weight for such clusters is set 
equal to 1, and the sample stabilization weight for the 
remaining clusters in the area is calculated after 
reducing the expected and actual number of dwellings 
in the area by the corresponding figures for the growth 
clusters. 


Finally, the non response balancing factor B is 
calculated as 


expected no. of sample households in (p,e,h,1,/) 
Sane = 


actual no. of sample households in (p,e,h,1,)) 
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8.8 Description algébrique de la ponderation 


Soit W,., le poids de base pour les enregistrements de la 
strate h dans la region économique e dans la province p. Pour 
obtenir le sous-poids, on modifiera ce poids par les facteurs 
qui suivent. 

Soit F,,.; le facteur rural-urbain pour la province p, la region 
économique e et le genre de secteur j. Pour les secteurs 
autoreprésentatifs, (j= 1), F,,,= 1. Nous allons definir a 


pe) 


present F pour les secteurs non autorepresentatifs. 


Soit P/s1)penij "@ NOMbre de personnes, selon le recense- 
ment de 1981, dans la province p, la region Economique e, la 
strate h, l’unité primaire d’échantillonnage i et le genre de 
secteur j. Dans les secteurs non autoreprésentatifs (NAR), la 
probabilité m,.,, de selection de lunite primaire d’echan- 
tillonnage (UPE) i dans la strate A, la region economique e, la 
province p est proportionnelle au chiffre de population de 
l'UPE selon le recensement de 1981 et est egale a: 


Pi ypehi. 
Tpehi = "peh 
P (81)peh.. 


ou n,,, est le nombre d’UPE choisies dans peh et lindice *' 
désigne une sommation sur un indice. Par conséquent, la 
population estimée en 1981 de la province p, la region econo- 
mique e, le genre de secteur j, d’apres les UPE échan- 
tillonnées est : 


P = 
os (81)pehij 
J EXE EA = yy ye a= 6, Sas 


hee i Tpehi 
Le facteur rural-urbain est donc 


P (81)pe..j 
F = eee 


Peli 

P (81)pe..j 
ou j = 2 pour les parties urbaines des secteurs NAR et j = 3 
pour les parties rurales des secteurs NAR. 


Normalement, le sous-poids de grappe C est egal a 1 sauf 
si la grappe a eté sous-échantillonnée parce qu'une trop 
grande croissance de la population s’y est produite. Il arrive 
cependant qu’on se serve du sous-poids de grappe pour 
rendre compte d’autres changements. Voir la section 8.5 pour 
plus de détails. 


Le poids de stabilisation de l’echantillon S est egal a 1a 
moins que le nombre réel de logements dans un secteur de 
stabilisation ne depasse le nombre prévu de logements dans 
ce secteur (ou allocation de base); a ce moment-la, on pose S 
egal au ratio du nombre reel au nombre prevu de logements. 
ll y a une exception: si le secteur de stabilisation contient des 
grappes ou la population s’est accrue et dont le sous-poids de 
grappe n’est pas 1, on pose a 1 le poids de stabilisation de 
l’échantillon de ces grappes et on calcule le poids de 
stabilisation de l’échantillon pour les grappes restantes apres 
avoir retranche du nombre prevu et du nombre réel de 
logements dans le secteur les nombres correspondants pour 
les grappes ou la population s’est accrue. 


Enfin, on calcule le facteur B de compensation pour la 
non-reponse par la formule : 


n° prévu de menages dans (p,e,h,1,)) 
Poti sg te, 1a oats aa ee 
n° reel de menages dans (p,e,h,iy) 


The expected number of households refers to the 
number of dwellings selected for a given month, minus 
the number of ineligible dwellings such as vacant 
dwellings, dwellings under construction, and so on. The 
actual number of households is the number of 
households for which a response is available either as 
a result of a successful interview or through the impu- 
tation procedure discussed in Section 8.4. 


The subweight is the product of the basic weight 
and the four factors that have just been defined: 


(0) = 
Ww pehijc ~~ Fae} Crenije SpenijcB vehi Wroch * 


Here, c denotes cluster, and p is province, e is 
economic region, A is stratum, i is PSU in NSR areas 
and is redundant for SR areas, and j is type of area. 
We can now describe the tranformation of the 
subweight into a final weight for estimation. Let y 
denote a variable of interest, such as whether a person 
is unemployed; y is an N by 1 vector with ith com- 
ponent equal to 1 if the corresponding individual in the 
population is unemployed and equal to 0 otherwise. N 
is the population size. Suppose that there are v 
auxiliary variables such as age-sex groups, economic 
regions and metropolitan areas available. For each 
individual in the population, a row vector of these v 
variables can in principle be created: it will consist of 
zeros everywhere except for the characteristics which 
apply to that individual. These N row vectors can be 
assembled into an N by v matrix Z. To take a greatly 
simplified example, suppose that the auxiliary variables 
are male, female, eastern-Canadian and western-Cana- 
dian. Then v equals 4 and Z is an N by 4 matrix. Two 
typical rows of Z would be (1,0,0,1) and (1,0,1,0). The 
first denotes a male living in western Canada and the 
second a male living in eastern Canada. According to 
the linear regression model, y and Z are related by 


Yo=eZ Bit se 


where eis a vector of error terms (deviations) and B is 
a vector of regression coefficients. Note that the model 
is for the whole population, which is unavailable. Since 
a sample is available, it can be used to estimate B by 


= (Z'WTZ)'Z'WTy, 


where T is a diagonal matrix with ith diagonal element 
equal to 1 if the corresponding individual is in the 
sample and 0 otherwise, and W Is the diagonal matrix 
of subweights W (the subweight for non-sample 
individuals can be set to 0). 


Note: This approach will lead to weights that are 
not the same for all household members. To ensure 
that there is a unique household weight, the rows of Z 
are modified as follows: each element of a row Is 
replaced by the household average, for example, if the 
household has five members and two are females in 
the same age group, then every member is assigned a 
value of 2/5 for that auxiliary variable (age-sex group). 
Thus, all members of a household will have identical 


rows in the matrix Z. 
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Le nombre prévu de ménages est le nombre de loge- 
ments choisis un certain mois, moins le nombre de logements 
qui ne sont pas admissibles comme les logements vacants, 
les logements en construction et ainsi de suite. Le nombre 
reel de ménages est le nombre de logements pour lesquels 
on a obtenu des réponses soit a la suite d'une interview soit 
par la methode d’imputation décrite a la section 8.4. 


Le sous-poids est le produit du poids de base et des 

quatre facteurs que nous venons de definir : 
W) ehije Pt F neji Cette Spenije® pehif Woeh+ 

Ici, ec designe la grappe et p, la province, e, la region 
economique, h, la strate, 1, 'UPE dans les secteurs NAR 
(redondant pour les secteurs autorepresentatifs) et /, le genre 
de secteur. Nous pouvons a present décrire comment le 
sous-poids devient le poids final aux fins de |’'estimation. Soit y 
une variable qui nous interesse, par exemple le fait qu'une 
personne soit en chomage; y est un vecteur de dimension N 
par 1 dont la ieme composante est egale a 1 si la personne 
correspondante dans la population est en chomage et egale a 
0 autrement. N est la taille de la population. Supposons qu'il y 
a v variables auxiliaires comme les groupes d’age-sexe, les 
regions economiques et les regions metropolitaines. Pour 
chaque personne dans la population, on peut en principe creer 
un vecteur ligne de ces v variables : il sera constitue de zeros 
partout sauf pour les caracteristiques qui s’appliquent a cette 
personne. On peut faire une matrice Z de N par v au moyen 
de ces N vecteurs lignes. Pour prendre un exemple tres sim- 
plifié, supposons que les variables auxiliaires sont homme, 
femme, Canadien de |'Est et Canadien de |’'Ouest. Alors, v est 
egal a 4 et Z est une matrice de N par 4. Deux rangees 
typiques de Z seraient (1,0,0,1) et (1,0,1,0). La premiere 
designe un homme qui vit dans l’ouest du Canada et la 
seconde, un homme qui vit dans |’est du Canada. Selon le 
modele de regression lineaire, le lien entre y et Z est le 
suivant : 


Y=ZB+e 


ou e est un vecteur de termes d'écarts (l’erreur) et B, un 
vecteur de coefficients de regression. Noter que le modele 
est pour la population entiere, sur laquelle on ne dispose pas 
de chiffres. Comme on a un échantillon, on peu s’en servir 
pour estimer B par la formule : 


b = (Z'WTZ)~'Z'WTy, 


ou T est la matrice diagonale dont l'ieme element diagonal est 
égal a 1 si la personne en cause est dans |’echantillon et egal 
a 0 autrement et ou W est la matrice diagonale des sous-poids 
WwW” (on peut poser a O le sous-poids des personnes non 
echantillonnees). 


Nota : Cette méthode donne des poids qui ne sont pas 
les mémes pour tous les membres d'un menage. Pour faire 
en sorte qu’on ait un seul poids par menage, on modifie les 
lignes de Z de la manieére suivante : chaque element d'une 
ligne est remplace par la moyenne pour le menage; par 
exemple, si le menage est constitue de cing membres dont 
deux sont des femmes du méme groupe d’age, on attribue la 
valeur 2/5 a chaque membre pour cette variable auxiliaire 
(groupe d’age-sexe). Ainsi, les lignes dans la matrice Z seront 
identiques pour tous les membres du menage. 


For each auxiliary variable, a census projection of 
the population total for the variable is assumed to be 
available. Let p denote the v by 1 vector of these 
projected totals. Let Y denote the total for the variable 
of interest, that is, Y = y’l, where 1 is a vector of 
ones. The total Y can be estimated by 


Y = b’p = y'WIZ(Z' WTZ) “'p. 


This estimator defines implicitly the vector of final 
weights 


w) = WTZ(Z'WTZ)~'p 


since the estimator of Y can be written as ¥ = y’W. 
Since the set of final weights W does not depend on 
the characteristic Y, it can be calculated once and then 
used for any characteristic of interest. The paper by 
Lemaitre and Dufour (1987) presents a more detailed 
description of the material in this section. 


8.9 An Example of Weighting a Record 


The weighting system is an integral part of the 
head office processing system. The inputs to the 
weighting system consist of an edited unweighted file, 
and a file containing cluster sub-weights, rural-urban 
factors and census projections by age-sex and 
subprovincial categories. Provincial inverse sampling 
ratios are contained in tabular form within the actual 
weighting program itself. The unweighted file is first 
processed to calculate balancing factors for non- 
response. At this stage, a file of balancing factors is 
created and a printout of the file is generated. 
Balancing units with unusually high non-response are 
collapsed and the balancing factor file is updated 
according to the revised balancing factors. 


For illustration, the weighting of a hypothetical 
record will be shown. Consider a record corresponding 
to a male, age 26 who was a respondent in PSU-GR- 
CLUS 81007-21-006 in the survey month in question. 
Other information necessary to weight this record will 
be assumed at the step at which it is required. 
Assumed values are not necessarily the actual values 
of the survey. 


Calculation of the balancing factor. The record 
under consideration is in the NSR rural portion of 
Stratum 81000 (the first stratum in Economic Regional 
1 of Alberta). The rural portions of each PSU selected 
in the stratum therefore form balancing units, i.e., in 
this case the rural portion of PSU 81007. To obtain the 
balancing factor it is necessary to divide the expected 
households (the number of households selected, 
excluding vacant dwellings) by the number actually 
interviewed or imputed on the basis of last month’s 
records. Assume also that cluster sub-sampling takes 
place in cluster 81007-21-006, and that in this case the 
cluster inverse sampling ratio (isr) was changed from 
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On suppose qu'on a un chiffre de population base sur une 
projection de recensement pour chaque variable auxiliaire. 
Soit p un vecteur de dimension v par 1 de ces totaux projetes. 
Soit Y le total pour la variable qui nous interesse, c’est-a-dire 
Y = y'l, ou 1 est un vecteur de uns. On peut estimer Y total 
par la formule : 


Y = b’p = y'WTZ(Z' WTZ) “'p. 


Cet estimateur définit implicitement le vecteur des poids 
finals 


Ww") = WTZ(Z'WTZ)~'p 


puisque l’estimateur d’Y peut étre formulé par |’équation Y = 
y'W®. Comme la série de poids finals W) ne depend pas de 
la caracteristique Y, on peut la calculer une fois et s’en servir 
pour n'importe laquelle des caractéristiques qui nous inte- 
ressent. L’article de Lemaitre et Dufour (1987) contient une 
description plus détaillee de la matiere présentee ici. 


8.9 Comment pondérer un enregistrement : un 
exemple 


Le systeme de pondération fait partie intégrante du 
systeme de traitement des données au bureau central. On 
introduit dans ce systeme un fichier de donnees non 
ponderées et verifiges et un fichier contenant les sous-poids 
de grappe, le facteur rural-urbain, les projections du recense- 
ment par age-sexe et les catégories infraprovinciales. Les 
fractions de sondage inverses pour les provinces sont incluses 
sous forme de tableaux dans le programme de ponderation 
luirmeme. La premiere opération a laquelle le fichier non 
pondéré est soumis est le calcul des facteurs de compen- 
sation pour la non-réponse. Un fichier de facteurs de 
compensation est créé et imprimé sur papier. Les unites de 
compensation ou le taux de non-réponse est exception- 
nellement élevé sont groupées et le fichier de facteurs de 
compensation est mis a jour en consequence. 


A titre d’illustration, voyons comment se fait la pondéra- 
tion d’un enregistrement hypothétique. Prenons le cas d’un 
enregistrement se rapportant a un homme de 26 ans qui aurait 
participe a l’enquéte dans |’UPE-GROUPE-GRAPPE 81007- 
21-006 le mois en question. Les autres renseignements né- 
cessaires a la pondeération de cet enregistrement seront 
fournis a l’étape ou l’on en aura besoin. Les valeurs 
hypothétiques ne sont pas nécessairement les valeurs réelles 
de l’enquéte. 


Calcul du facteur de compensation — L’enregistrement 
que nous allons etudier est dans la partie rurale d’un secteur 
NAR de la strate 81000 (la premiere strate dans la région 
economique (RE) 1 de |’Alberta). Les parties rurales de 
chaque UPE choisie dans la strate forment donc des unités de 
compensation, en l’occurrence la partie rurale de |'UPE 81007. 
Pour obtenir le facteur de compensation, il faut diviser le 
nombre prevu de ménages (le nombre de ménages échantil- 
lonnes moins les logements vacants) par le nombre de 
menages reellement interviewés ou pour lesquels les données 
ont ete imputées d’apres les réponses fournies le mois 
precedent. Supposons également que la grappe 81007-21-006 
est sous-echantillonnée et que la fraction de sondage inverse 


one to seven. The cluster sub-weight then is seven. 
Further assume that in the cluster, the expected take is 
eight pe oebelee (if the isr had not been modified, the 
expected take would have been a roximatel 

7x8 = 56 households). Bi : 


Of the eight households, assume six were 
respondents, one was not at home this month but had 
responded last month, and the last household was non- 
respondent for the second consecutive month. The 
response status of the first month non-respondent 
household for which there was a previous month’s 
response would have been changed to a response 
prior to weighting, so that for the purposes of weighting 
the respondent households number seven, with one 
nonrespondent household. 


In the remainder of the balancing unit (rural portion 
of PSU 81007), assume that the expected households 
were 44, the number of enumerated households equals 
35, and further that the only cluster in the balancing 
unit with a cluster sub-weight is cluster 81007-71-006. 
The expected number of households according to the 


design in the balancing unit is then given by 
44+ (cluster sub-weight x expected take) = 
44+(7x8)= 100, and the expected number of 


enumerated households is given by 35+ (cluster sub- 
weight x enumerated households) = 35+(7x7) = 84 
(since households in sub-sampled clusters are 
weighted to reflect expected sample according to the 
design). The balancing unit weight B,,,, 
100/84 = 1.19048. If B,,,;,had been greater than three, 
then collapsing of units would take place and the rural 
portion for the whole stratum would be considered as a 
balancing unit for non-response, instead of each PSU 
being considered separately. The balancing factors 
would be recalculated on this basis. 


Calculation of the subweight. The PSU-GR 
identifies the record as NSR rural for Alberta which 
establishes the following weights: the basic weight 
Wye, = 125, and the rural-urban factor for the province 
Foo = 0.997114 (reflecting the fact that in the selected 
PSUs in Alberta at this time the rural population was 
slightly overrepresented). The balancing factor 
Boon = 1.19048 was calculated previously, and a 
cluster sub-weight of 7.0 is input and applied to the 
records in this cluster. Finally, assume that no 
stabilization takes place in the area containing this 
PSU, i.€., Spepije = 1. Thus, the subweight for the cluster 
is given by: 


W 


pehy Sova: 2 of Cpehige > pehifc 


peh pe 
125 x 0.997114 x 1.19048 x 7x 1 
148.38053 x 7 


1038.6637 


i 


Calculation of the final weight. The procedure 
we have just described is applied to each record on 
the file. The file is processed as described in Section 
8.8 to produce a final weight for each record. 
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(fsi) est passée de un a sept. Le sous-poids de la grappe est 
alors de sept. Supposons enfin que le rendement prévu de 
l'echantillon de la grappe est de huit ménages (si la fsi n’avait 
pas ete modifiee, le rendement prévu aurait été d’environ 
7x8 = 56 ménages). 


Supposons que, sur les huit ménages, six ont fourni des 
reponses, un n’a pas été rejoint ce mois-ci mais avait fourni 
des reponses le mois précédent et le dernier n’a pas fourni de 
reponses pour le deuxiéme mois consécutif. Le statut du 
menage qui n’a pas fourni de réponses ce mois-ci mais qui 
l'avait fait le mois précédent est changé avant la ponderation 
de sorte qu'il est considéré comme un meénage repondant; 
pour les besoins de la pondération, on compte donc qu'il y a 
sept menages repondants et un menage non repondant. 


Supposons que, dans le reste de I'unite de compensation 
(partie rurale de |'UPE 81007), le nombre préevu de menages 
etait de 44 et le nombre de menages interviewes, de 35 et par 
ailleurs que la seule grappe sous-pondeéree est la grappe 
81007-71-006. Le nombre prevu de menages d'apres le plan 
de sondage dans |’uniteé de compensation se calcule donc 
ainsi! : 44+ (sous-poids de la grappe x rendement prevu) = 
44+(7x8) = 100, et le nombre prévu de menages interviewes 
se calcule ainsi : 35+ (sous-poids de la grappe x nombre de 
meénages interviewes) = 35+(7x7) = 84 (étant donne que le 
nombre de ménages dans les grappes sous-echantillonnees 
est pondeére en fonction de |’échantillon prevu selon le plan de 
sondage). Le poids de l’unite de compensation B,,,, est egal 
a: 100/84 = 1.19048. Si B,,,, avait ete superieur a 3, on aurait 
groupe des unites, consideré la partie rurale de la strate 
entiere comme une unité de compensation pour la non- 
reponse au lieu de considerer chaque UPE separement et 
recalcule les facteurs de compensation sur cette base. 


Calcul du sous-poids — Le code d’UPE-GR nous dit que 
l'enregistrement est celui d’une personne qui habite dans une 
UNAR rurale en Alberta, de sorte que les poids sont les 
suivants : le poids de base W,,, = 125 et le facteur rural- 
urbain pour la province F,,,, = 0.997114 (ce qui montre que, a 
ce moment la, dans les UPE echantillonnees en Alberta, la 
population rurale est legerement surrepresentee). Le facteur 
de compensation B,,,;, = 1.19048 a deja été calcule, et un 
sous-poids de grappe de 7.0 est attribue aux enregistrements 
dans cette grappe. Supposons enfin que le secteur dans 
lequel se trouve cette UPE n'a pas ete stabilise, autrement dit 
que S,eAyc = 1. On calcule donc le sous-poids de la grappe 
par la formule : 


W shi = Week Fg; C rahe Srghitic 

125 x 0.997114 x 1.19048 x 7 x 1 
148.38053 x 7 
1038.6637 


iT] 


iT] 


Calcul du poids final — L'operation que nous venons de 
deécrire est effectuee pour chacun des enregistrements dans le 
fichier. Pour obtenir le poids final pour chaque enregistrement, 
on traite le fichier de la maniere indiquée a la section 8.8. 


8.10 Variance Estimation 

LFS estimates are based on a sample. If several 
independent samples using the LFS design were to be 
selected for a given month, different estimates would 
be obtained since each sample would be different. A 
measure of the variability of these estimates would 
provide an indication of the reliability of an estimate 
produced using the actual LFS sample. Because the 
LFS is a probability survey, it is possible to obtain such 
a measure, namely the variance, for each estimate. 


Although the sampling and estimation procedures 
for the LFS are complex, the variance estimation 
method, using a technique known as the jackknife, Is 
conceptually simple. Each cluster in SR areas and 
each PSU in NSR areas will be referred to as a 
replicate. Suppose that Y is the characteristic of 
interest and Y is its estimate, as described in Section 
8.8. Remove a replicate i from its stratum h and 
adjust the remaining replicates in the stratum to com- 
pensate for the removal: if there were originally, say, 
three replicates, then the adjustment is 3/2. Leaving all 
other strata with their full samples, apply the regression 
procedure described in Section 8.8 to obtain an 
estimate Y,,, of Y; the subscript (Az) indicates that the 
estimate is obtained after replicate i in stratum A is 
removed. Now repeat these steps for every replicate 
in every stratum. This yields as many estimates Y,,,) 
as there are replicates in the sample, in addition to the 
original LFS estimate Y. The jackknife variance esti- 
mate of Y is given by 


a (30) i a 
var(Y) = yy SS Ne CK = 1a 
Np 

h i 
where n,is the number of replicates in stratum A Like 
previous variance estimation procedures used in the 
LFS, the current estimator’s validity is based on the 
assumption that replicates are selected independently, 
which is approximately true for the LFS design. The 
jackknife in this case normally leads to a_ slight 
overestimation of variances and, thus, is conservative. 


Variance estimates are produced monthly for 
many characteristics at various levels, such as pro- 
vince, economic region and census metropolitan area. 
The presentation and use of these figures is discussed 
further in the next chapter. 
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8.10 Estimation de la variance 

Les estimations de l'EPA dont basées sur des données 
recueilliles auprés d'un échantillon. Si, un certain mois, on 
prélevait plusieurs echantillons indépendants en se servant du 
plan de sondage de |’EPA et qu’on produisait des estimations 
d’aprés les données recueillies aupres de chacun, ces estima- 
tions seraient différentes puisque les echantillons seraient 
differents. Une mesure de la variabiliteé de ces estimations 
nous donnerait une indication de la fiabilite des estimations 
produites a partir de l’échantillon réel de EPA. Comme |’EPA 
est une enquéte a échantillonnage probabiliste, il est possible 
d’obtenir une telle mesure, a savoir la variance, pour chaque 
estimation. 


Bien que les méthodes d’échantillonnage et d’estimation 
de |’'EPA soient complexes, la methode d’estimation de la 
variance, qui utilise une technique dite du jacknife, est simple 
du point de vue théorique. Chaque grappe des secteurs AR et 
chaque UPE des secteurs NAR est considéreée comme une 
replique. Supposons que Y est la caractéristique qui nous 
intéresse et que Y est l’estimation qui S'y rapporte, comme 
nous l’avons vu a la section 8.8. On retire une réplique i de 
sa strate h et on rajuste les repliques qui restent dans la strate 
pour compenser; s'il y avait au départ disons trois repliques, 
le rajustement est de l’ordre de 3/2. En ne touchant pas aux 
échantillons des autres strates, on applique la methode fondee 
sur la regression décrite a la section 8.8 pour obtenir une esti- 
mation Y,,, de Y; Ilindice (hi) indique qu'on a_ obtenu 
estimation apres avoir retire la réplique i de la strate h. 
Répétons cette opération pour chaque réplique dans chaque 
strate. On obtient autant d’estimations Y,,, quil y a de 
repliques dans la strate, en plus de |l’estimation originale de 
EPA Y. On calcule l’estimation de la variance de Y par la 
technique dite du jacknife par la formule : 


, Us 9) es 
var(Y)i= Soa ae DU) Ue wea 
h i 

ou n, est le nombre de répliques dans la strate h. La validité 
de l’estimateur actuel, comme celle des methodes d’esti- 
mations de la variance utilisées antérieurement pour |’EPA, 
suppose que les répliques sont préleves de facon indépen- 
dante, ce qui est a peu pres vrai pour le plan de |’EPA. 
Lorsqu’on utilise la technique dite du jacknife dans ce cas, 
estimation de la variance est légerement supérieure a ce 
qu'elle devrait étre; cette technique est donc modérée. 


Np 


On produit chaque mois des estimations de la variance 
relativement a de nombreuses caractéristiques et pour divers 
niveaux geographiques comme la province, la région écono- 
mique et la région meétropolitaine de recensement. Il sera 
question plus amplement de la présentation et de l'utilisation 
de ces données dans le prochain chapitre. 


Chapter 9 


Data Quality 


9.1 Introduction 


To appreciate the value of data obtained from a 
sample survey, such as the Labour Force Survey, it is 
necessary to understand clearly the role of Sampling 
error and Non-sampling error in surveys. 


In sample surveys, inference is made about the 
entire population covered by the survey on the basis of 
data obtained from only a part (sample) of that 
population. The results are likely to be different from 
those that would be obtained if the entire population 
were enumerated under the same survey conditions. 
The error arising from drawing inferences about the 
entire population on the basis of information from a 
sample is termed sampling error. 


Non-sampling error, as the name implies, has 
nothing to do with the sampling process and is present 
in a Census (where all units of the population are 
enumerated) as well as in a sample survey. This type 
of error is associated with the processes of the survey 
at all stages, from data collection and processing 
through to the final tabulations. 


This chapter, after a brief discussion of sampling 
error in sections 9.2 and 9.3, describes the sources of 
non-sampling errors, the means used to detect, 
measure and assess each type and the monitoring and 
corrective procedures used to minimize them. 


9.2 Sampling Error 


The magnitude of the sampling error for survey 
estimates depends on many factors. The most obvious 
is the size of the sample. The larger the sample size, 
the smaller the sampling error. For a given sample 
size, the sampling error will depend on various features 
of the sample design, such as the stratification proce- 
dure employed, the allocation of the sample, the 
choice of sampling units and the method of selection 
used at the different stages of sampling in a multi- 
stage design. In addition, for a given sample design, 
different estimation procedures will result in different 
sampling errors. Finally, given a common sample size, 
sample design and estimation procedure, estimates of 
different characteristics will generally have different 
sampling errors. Characteristics that are relatively 
scarce or unevenly distributed in the population will 
tend to have larger sampling errors than characteristics 


Chapitre 9 


Qualité des données 


9.1 Introduction 


Pour apprécier la qualité des données recueillies au 
moyen d'une enquéte par sondage comme |’enquete sur la 
population active, il faut bien comprendre le role que jouent 
’erreur d’echantillonnage et l’erreur non due a |’echan- 
tillonnage dans ce genre d’enquéte. 


Dans une enquéte par sondage, des inférences sont faites 
au sujet de la population visee entiere a partir de donnees 
recueillies aupres d'une partie seulement (d'un echantillon) de 
cette population. Les resultats sont probablement differents de 
ceux qu'on obtiendrait si on menait un recensement complet 
aupres de cette population dans les memes conditions que 
celles de |’enquete. L’erreur d’échantillonnage decoule du fait 
que les inferences portant sur la population entiere sont 
basees uniquement sur un échantillon provenant de cette 
population. 


L’erreur non due a |'échantillonnage, comme son nom 
lindique, n’a rien a voir avec le processus d’echantillonnage 
et se produit dans un recensement (auquel participent toutes 
les unites de la population) aussi bien que dans une enquete 
par sondage. Ce genre d’erreur est associé a toutes les 
etapes de |’enquete, de la collecte au traitement des donnees 
et meme jusqu’a la production des totalisations finales. 


Dans ce chapitre, nous allons d’abord parler brievement 
de l’erreur d’echantillonnage (sections 9.2 et 9.3), puis nous 
allons décrire les sources des erreurs non dues a |'echantil- 
lonnage, les moyens utilisés pour détecter, mesurer et evaluer 
chaque catégorie d’erreur de ce genre et les mesures en 
place (verification, correction) visant a en reduire le nombre au 
maximum. 


9.2 Erreur d’échantillonnage 


L’'ampleur de |l’erreur d’echantillonnage dont sont enta- 
chées les estimations d’enquete est fonction d’un grand nom- 
bre de facteurs. Le plus evident est la taille de |’echantillon. 
Plus un échantillon est grand, plus |’erreur est petite. Pour un 
échantillon d’une taille donnée, |’erreur d’échantillonnage est 
liée a diverses caracteristiques du plan de sondage comme la 
méthode de stratification utiliseée, la repartition de |’echantillon, 
le choix des unites d’échantillonnage et la methode de selec- 
tion employee a chaque degre d’echantillonnage s'il s’agit 
d'un plan a plusieurs degres. En outre, pour un plan de 
sondage donne, différentes methodes d’estimation entrai- 
neront des erreurs différentes. Enfin, méme si la taille de 
|'echantillon, le plan de sondage et la méthode d’estimation 
sont pareils, les estimations relatives aux differentes caracte- 
ristiques sont généralement entachees d’erreurs d’echan- 
tillonnage différentes. Ces erreurs sont habituellement plus 
grandes pour les caracteristiques relativement rares ou 


that are common or widely distributed. For example, 
the sampling error for estimates of unemployment will 
generally be higher than for estimates of employment, 
although both are estimated from the same sample. 


The efficiency of a sample design and estimation 
procedure is usually measured by the mean square 
error of one or more characteristics. The mean square 
error is defined as the average of the square of 
deviations of the estimate of the characteristic from the 
"true value" taken over all possible samples. The 
average of the estimates over all possible samples is 
termed the expected value of the estimate. The 
difference between the expected value and the true 
value is termed the bias of the estimate. The variance 
of the sample estimate is the average of the squared 
difference of the estimate from its expected value. The 
square root of the variance is called the standard 
deviation (or standard error) of the estimate. 


lf the estimation procedure were unbiased, the 
expected value and the true value of the estimate 
would be the same and thus the mean square error 
and the variance would be the same. Certain 
estimation procedures (such as the one used in the 
LFS), though negligibly biased, yield smaller mean 
square errors than other unbiased procedures. 


The most important feature of a probability sample 
is that the variance of the estimate (and hence the 
standard deviation) can be estimated from the sample 
itself. 


An additional measure of quality derived from the 
sample is known as the design effect. It is defined as 
the ratio of the variance of an estimate derived from 
the sample survey having a particular design to the 
variance of the estimate derived from the same sample 
survey — but assuming a simple random sample 
design. The design effect provides a comprehensive 
measure of the combined effect of all the design 
features, such as stratification, multistage sampling and 
estimation. Design effects can serve as an index to 
measure the deterioration of the overall design over 
time. The lower the design effect the more efficient the 
design. Measures of design effects, as well as other 
information, are used in determining areas for design 
updates discussed earlier in Section 3.4. Some 
representative design effects are shown in the table. 
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réparties inégalement dans la population que pour les carac- 
téristiques frequentes ou réparties de facon homogene. Les 
estimations du chdmage, par exemple, sont géeneralement 
entachées d'une plus grande erreur d’échantillonnage que les 
estimations de l’emploi, bien que les deux soient basées sur 
le méme échantillon. 


On se sert habituellement de l’erreur quadratique 
moyenne d'une ou de plusieurs caractéristiques pour 
mesurer l’efficacité du plan de sondage et de la methode 
d’estimation. L’erreur quadratique moyenne est définie 
comme étant la moyenne des carrés des ecarts de la valeur 
estimee de la caractéristique par rapport a sa valeur reelle 
pour tous les échantillons possibles. La moyenne des esti- 
mations pour tous les échantillons possibles s’appelle l’espeé- 
rance mathématique de |’estimation. La difference entre 
l'espeérance mathematique et la valeur reelle s’appelle le biais 
de |’estimation. La variance de |’estimation d’echantillon est 
la moyenne des carrés des ecarts de |’estimation par rapport 
a son espérance mathématique. On appelle la racine carrée 
de la variance l’écart type (ou erreur type) de |’estimation. 


Si la méthode d’estimation n’était pas biaisée, |’espérance 
mathematique et la valeur réelle de l’estimation seraient iden- 
tiques, et par consequent |’erreur quadratique moyenne et la 
variance seraient identiques également. Certaines methodes 
d’estimation (comme celle dont on se sert pour I’EPA), bien 
que causant un biais négligeable, donnent lieu a de plus 
petites erreurs quadratiques moyennes que d’autres métho- 
des non biaisées. 


La caractéristique la plus importante d’un échantillon 
probabiliste est que la variance de |’estimation (et donc l’écart 
type) peut étre estimée a partir de !’echantillon lui-méme. 


Il y a une autre mesure de la qualité qui s’obtient a partir 
de I’échantillon, et c'est effet du plan. On le deéefinit comme 
étant le rapport entre la variance d’une estimation tirée d’une 
enquéte par sondage ayant un plan donne et la variance de 
estimation tirée de la méme enquéte pas sondage, mais dont 
la methode d’échantillonnage serait la methode aléatoire sim- 
ple. L’effet du plan donne une mesure globale de |’effet 
combiné de toutes les caractéristiques du plan, comme la 
stratification, |’échantillonnage a plusieurs degres et |’esti- 
mation. L’effet du plan peut servir d’indice de la détérioration 
du plan avec le temps. Par exemple, une diminution de |’effet 
du plan indique que le plan devient plus efficace. On a 
recours a la mesure de l’effet du plan ainsi qu’a d'autres 
renseignements pour decider des secteurs ou la mise a jour 
du plan, dont nous avons parlé a la section 3.4, est 
nécessaire. Le tableau qui suit présente quelques valeurs 
representatives de leffet du plan pour la caractéristique 
chomage. 


Design Effects, Unemployed - August 1989 
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Effet du plan, chOmeurs - aout 1989 


Province ‘i ian alae 
Les deux sexe Hommes Femmes 
Newfoundland — Terre-Neuve 
4 K : Me ; : 
Prince Edward Island —- lle-du-Prince-Edouard 1 Bs 6 a 
Nova Scotia - Nouvelle-Ecosse 1.20 1.09 1.04 
New Brunswick — Nouveau-Brunswick 1.87 141 1.18 
re 1.61 1.54 1.25 
ania’ 127 1,27. 1.38 
anitoba 2.09 1.74 1.61 
Saskatchewan 1.24 1.19 129 
Alberta . 1.55 152 1.48 
British Columbia - Colombie-Britannique 1.80 1.69 1.65 
Canada 1.49 1.45 1.35 


9.3 Presentation of Sampling Errors 


The estimated standard error can be used to 
provide a confidence interval of an estimate in the 
following way. If the estimated value of a characteristic 
in some area is X and the standard error of that 
estimate is d, then, in many cases the interval X + d 
will contain the "true" value about 68 times out of a 
hundred and the interval X + 2d will contain the true 
value 95% of the time. It is often convenient to 
express the standard error as a percentage of the 
estimate and this is known as the coefficient of 
variation (CV). 


Rough confidence intervals for the LFS estimates 
may be obtained from the letter symbols given in 
many of the tables in the monthly LFS publications. 
The letter symbols refer to ranges of percentage 
coefficient of variation for the characteristics. The letter 
symbol gives the user an indication of the reliability of 
the estimate. The ranges of values for the symbols are 
as follows: 


A (0.0 - 0.5%) F (10.1 - 16.5%) 
B (0.6 - 1.0%) G (16.6 - 25.0%) 
Ca 2.5%) H (25.1 - 33.3%) 
D (2.6 - 5.0%) J (33.4% +) 

E (5.1 - 10.0%) 


The letter values in the tables are updated twice a 
year and are based on a six-month average of the CVs 
of the characteristic. In addition to these symbols, an 
explanatory note on reliability and other limitations of 
the data is provided in the publications. 


The Labour Force Survey produces many 
thousands of estimates of labour force characteristics. 
These are available at national, provincial and sub- 
provincial levels for monthly estimates, month-to-month 
change, averages of levels and year-to-year change in 
annual averages. Due to space limitations, it is not 
possible to include direct estimates of CVs for all 
survey estimates in regular and special publications. 
However, look-up tables are available giving CV 
approximations for various groupings of estimates. 


9.3 Presentation des erreurs d’echantillonnage 


On peut se servir de l’erreur type estimeée pour obtenir 
l'intervalle de confiance d’une estimation; il s'agit de proceder 
de la maniere suivante. Si la valeur estimeée d'une carac- 
teéristique dans un certain secteur est X et que |’erreur type de 
cette estimation est d, alors, dans un grand nombre de cas, 
l'intervalle X + d contiendra la valeur reelle environ 68 fois sur 
100 et l'intervalle X + 2d, 95 fois sur 100. Il est souvent 
pratique d’exprimer l'erreur type en pourcentage de |'estima- 
tion; on parle alors de coefficient de variation (CV). 


ll est possible de se faire une idee approximative des 
intervalles de confiance des estimations de |’EPA a partir des 
symboles en caracteres alphabetiques indiques dans un bon 
nombre des tableaux contenus dans les publications men- 
suelles se rapportant a cette enquéte. Les symboles en 
question indiquent dans quel intervalle se situe le coefficient 
de variation pour la caracteristique. lls renseignent le lecteur 
sur la fiabilité de l’estimation. Les tranches de valeurs corres- 
pondant a chaque symbole sont les suivantes : 


A (0.0 - 0.5%) F (10.1 - 16.5%) 
B (0.6 - 1.0%) G (16.6 - 25.0%) 
C (1.1 - 2.5%) H (25.1 - 33.3 %) 
D (2.6 - 5.0%) J (33.4% + ) 

E (5.1 -10.0%) 


Deux fois par an, on revise les tableaux et on determine 
s'il y a lieu de changer les lettres compte tenu de la moyenne 
des coefficients de variation pour les caractéristiques sur les 
six derniers mois. Les publications contiennent, outre ces 
symboles, une note explicative sur la fiabilite des données et 
les lacunes que celles-ci pourraient comporter. 


On produit des milliers d’estimations des caracteéristiques 
de la population active a partir des resultats de l’enquéte sur 
la population active. Il y a des estimations mensuelles, des 
estimations de la variation d’un mois a l'autre, des estimations 
des moyennes de niveau et des estimations de la variation 
des moyennes annuelles, et ce au niveau national, provincial 
et infraprovincial. L'espace disponible dans les publications 
normales et spéciales ne permet pas d’inclure des estimations 
directes des CV pour toutes les estimations de |’enquéte. II 
existe cependant des tables de recherche qui contiennent des 
approximations des CV pour divers groupes d’estimations. 


9.4 Non-Sampling Errors 


Non-sampling error (like sampling error) may be 
divided into two components, variance and bias. Non- 
sampling variance has a tendency to be in either 
direction and thus the net effect of this component may 
be negligible over many observations or for large 
areas; but for small areas or rare or sensitive charac- 
teristics, it can be large. An example of this would be 
checking one response box by mistake when another 
was reported. The non-sampling bias, on the other 
hand, has a tendency to occur in one direction more 
than the other. For example, it may be the result of 
such things as the training or attitude of the 
interviewer, a fault in questionnaire design, or the 
method of imputation for non-response, that may tend 
to invite error in one direction more than the other. 


Contributions to non-sampling variance and bias 
may arise through one or more of the following main 
sources of error: 


Coverage Error 


Coverage errors are introduced whenever the 
frame of sample units does not adequately represent 
the target population at the time of the survey. These 
errors are caused by (1) units in the target population 
that are missed from the sampling frame (under cover- 
age), (2) units included in the sampling frame that are 
not in the target population (over coverage), and (3) 
units in the target population that are included more 
than once in the sampling frame (duplication). 


Coverage errors may occur at several stages of 
the survey, such as during frame preparation, sampling 
unit definition, assigning of the selection probabilities 
for sampling purposes or at the data collection and 
processing stages. The net under coverage or over 
coverage in the LFS is estimated by the Slippage rate. 
Slippage is the difference between population esti- 
mates obtained by summing subweighted LFS sample 
records and population estimates derived from inde- 
pendent sources such as the Census. 


Coverage errors in the LFS generally result in a 
net under coverage of the population. To minimize any 
bias resulting from this, the sample estimates are 
adjusted to external control totals in the estimation 
procedure — see chapter 8. The result is that the LFS 
estimates obtained by weighting up the sample counts 
in various age-sex groups, economic regions and 
CMAs are equal to corresponding population totals 
from the most recent Census-based population projec- 
tions. Average slippage rates and estimated standard 
deviations of the rates for the 1988 calendar year are 
given in the following table. 
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9.4 Erreurs non dues a I|’éechantillonnage 


L’erreur non due a |l’échantillonnage a, comme |'erreur 
d’échantillonnage, deux composantes : la variance et le biais. 
La variance non due a |’échantillonnage va generalement dans 
un sens ou dans l'autre de sorte que son effet net peut étre 
négligeable si le nombre d’observations est elevé ou s'il s’agit 
de grands secteurs; toutefois, il peut etre eleve lorsqu’il s’agit 
de petits secteurs ou bien lorsque les caracteéristiques a 
l'étude sont rares ou rattachées a des questions delicates. Un 
exemple de ce genre d’erreur se produit lorsqu’un_ inter- 
vieweur coche une case ne correspondant pas a la réponse 
donnée par le repondant. Le biais non du a |’echantillonnage 
a, pour sa part, tendance a se produire dans un sens plus que 
dans l'autre. Il peut étre attribuable a la formation ou a 
l’attitude de l’intervieweur, a une faille dans la conception du 
questionnaire ou a la méthode d’imputation utilisee pour re- 
médier a la non-reponse. L’'ensemble de ces facteurs peuvent 
contribuer a provoquer |’accumulation des erreurs dans une 
direction plus que dans |’autre. 


Les categories d’erreurs Suivantes peuvent contribuer a la 
variance non due a |’echantillonnage et au biais. 


Erreur de couverture 


Il se produit des erreurs de couverture lorsque la popu- 
lation cible n'est pas représentée adéquatement dans la base 
des unites d’echantillonnage au moment de l’enquéte. Il se 
peut que des unites aient ete omises de la base de sondage 
(sous-dénombrement), que des unités ne se trouvant pas dans 
la population cible y aient été incluses (surdénombrement) ou 
que des unites s’y retrouvent plus d’une fois (répétition). 


Les erreurs de couverture peuvent se produire a plusieurs 
étapes de l’enquéte: pendant la constitution de la base de 
sondage, la definition des unites d’échantillonnage, |’attribution 
des probabilités de sélection aux fins de l’échantillonnage ou 
encore la collecte ou le traitement des données. Le taux de 
glissement donne une estimation du sous-dénombrement ou 
du surdénombrement net de l’EPA. Il mesure |’écart entre les 
estimations de la population que l’on obtient en additionnant 
les enregistrements sous-ponderes de |’échantillon de |l'EPA 
et les estimations de la population provenant de sources 
indépendantes comme le recensement. 


Les erreurs de couverture de I'EPA donnent habituelle- 
ment lieu a un sous-dénombrement de la population. Pour 
réduire au maximum le biais qui en resulte, au cours du 
processus d’estimation, on corrige les estimations d’échan- 
tillon en fonction de totaux de controle provenant d'autres 
sources que l’EPA (voir le chapitre 8). Par consequent, les 
estimations de I'EPA que l'on obtient en pondérant les 
données d’échantillon pour les divers groupes d’age-sexe, 
régions économiques et RMR sont égales aux chiffres de 
population correspondants que l'on a d’apres les projections 
de la population fondées sur le dernier recensement. Le 
tableau qui suit contient les taux de glissement moyens et les 
ecarts types estimes des taux pour |l’année civile 1988. 


Average Slippage Rates arid 
Deviations rto8e id Standard 


Canada (With Age Groups) and Provinces 
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Taux de glissement moyens et écarts 
types -— 1988 


Canada (selon les groupes d’age) et provinces 


Slippage Standard 

Deviation 

Glissement Ecart type 

Canada Overall - Global 4.93 0.80 

15-19 years - ans 4.54 1.78 

20-24 years -— ans 9.49 1.65 

25-44 years -— ans 5.53 1.20 

45-64 years - ans 3.74 1.09 

Newfoundland - Terre-Neuve Oe I ee si we 

Prince Edward Island — {le-du-Prince-Edouard 7.35 2.24 

Nova Scotia - Nouvelle-Ecosse 6.10 1.95 

New Brunswick — Nouveau-Brunswick 6.00 1.55 

Quebec 2.26 1.77 

Ontario 5.67 1 53 

Manitoba 6.09 1.83 

Saskatchewan 7.94 1 62 

Alberta 6.18 1.75 
British Columbia — Colombie-Britannique 


4.99 2.10 


Non-response Error 


Each month, during the designated survey week, 
every reasonable effort is made to interview all eligible 
persons in selected dwellings. For various reasons this 
is not always possible. These non-interviews occur for 
the following reasons: 


— Household non-response: This includes no one at 
home, temporary absence, interview impossible 
(weather conditions, unusual circumstances in the 
household, etc.) and refusals. 


— Vacant dwellings: This includes unoccupied 
dwellings, seasonally occupied dwellings, dwellings 
under construction and those occupied by persons 
not eligible to be interviewed. 


— Non-existent dwellings: This includes demolished 
dwellings, dwellings converted to business pre- 
mises, mobile homes that had been relocated or 
dwellings that had been abandoned or listed in 
error. 


Data for non-responding units are imputed using 
data from similar responding units or using earlier data 
from the non-responding units, if available. The extent 
of any bias due to imputation is usually unknown and is 
very much dependent on characteristic differences 
between the responding and non-responding groups of 
units. The impact of this bias increases with increases 
in the non-response rate and so attempts are made to 
maintain a response rate as high as possible. 


Vacant and non-existent dwellings do not con- 
tribute to any bias in the sample but do result in a 
higher sample variance due to a smaller household 
count. Some typical non response rates are given 


below. 


Non-reponse 


Chaque mois, pendant la semaine d’enquéete choisie, on 
s'efforce d'interviewer toutes les personnes admissibles dans 
les logements echantillonnes. Il n'est pas toujours possible de 
le faire, et ce pour les raisons suivantes : 


— Non-reponse du menage : Personne a la maison, absence 
temporaire, interview impossible (mauvais temps, cCir- 
constances inhabituelles dans le menage, etc.) ou refus. 


— Logement vacant : Logement non occupe, logement sai- 
sonnier, logement en construction ou logement occupe par 
des personnes ne devant pas étre interviewees. 


- Logement non existant : Logement demoli, logement trans- 
forme en local d'affaires, maison mobile demenageée ou 
encore logement abandonne ou inscrit par erreur. 


Pour les unites non repondantes, les donnees man- 
quantes sont déterminées a partir des données provenant 
d’unites semblables ou des données fournies anterieurement 
par les unités elles-mémes (si elles existent). L'’importance du 
biais attribuable a l’imputation est habituellement inconnue, 
mais on sait qu'elle est étroitement lice aux differences de 
caractéristiques entre les groupes d’unites repondantes et les 
groupes d'unités non repondantes. Comme l'effet de ce biais 
s'accroit avec l’augmentation du taux de non-réponse, on 
essaie de maintenir le taux de réponse a un niveau aussi 
eleve que possible. 


Les logements vacants et non existants ne contribuent 
pas au biais dans lechantillon, cependant, ils produisent une 
hausse de la variance de |’échantillon puisqu’ils reduisent le 
nombre de logements. Le tableau qui suit contient des taux de 
non-réeponse typiques pour |’EPA. 


Household Non Response Rates 
Canada and Provinces - 1988 
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Taux de non-reponse globaux 
Canada et provinces - 1988 


Average High Low 

Moyenne Maximum Minimum 
Canada 5.08 6.40 4.40 
Newfoundland — Terre-Neuve , 4.69 7.70 3.30 
Prince Edward Island — |le-du-Prince-Edouard 3.36 5.10 2.00 
Nova Scotia - Nouvelle-Ecosse 5.63 7.30 4.70 
New Brunswick - Nouveau-Brunswick 4.98 6.30 3.60 
Quebec 4.91 7.30 4.00 
Ontario 4.76 6.40 3.80 
Manitoba 5:36 6.90 4.20 
Saskatchewan 5.26 6.70 3.90 
Alberta S28) 6.30 4.10 
British Columbia — Colombie-Britannique 5.63 6.70 4.20 


Refusal rates in the LFS are generally very low. 
The monthly rates in 1989 were usually between 1.1 
and 1.3 percent, with a maximum of 1.6 percent. 
Provincial refusal rates usually fall in the same range, 
but may be as low as 0.8 percent and as high as 2.0 
percent. 


Response Error 


This error may be due to questionnaire design, the 
wording of the questions, the attitude of the 
respondent, the interviewing approach or other general 
conditions under which the survey is conducted. 
Response errors may occur when data are requested, 
provided, received or recorded. Questions may be 
misinterpreted by the respondent who may not know, 
may not remember or may purposely wish to distort 
the correct answer. Different interviewers may have 
different tendencies in explaining questions or 
interpreting responses, and so on. Response errors, 
like other errors, can have both a variance and a bias 
component. Estimates of response variance and 
response bias can be obtained from the Reinterview 
Program, which is discussed in Section 9.5. 


Proxy response, which is the collection of infor- 
mation pertaining to other household members from 
one member of the household, can also lead to 
response errors. 


In repeated surveys, where the sample is made up 
of a number of independent panels or rotation groups, 
the expected values of estimates differ slightly from 
one rotation group to the next. This is known as 
rotation group bias. In the LFS, this effect is most 
pronounced for the one-sixth of the sample that are 
first time interviews. However, the rotation scheme 
ensures that the impact of rotation group bias is 
minimized by having five-sixths of the sample in 
common from one month to the next. A rotation group 
index can be calculated as the ratio of an estimate 
calculated from that portion of the sample in the survey 
for a particular time (first month, second month etc.) to 


Les taux de refus pour |’EPA sont habituellement tres bas. 
En général, les taux mensuels en 1989 ont varie entre 1.1 et 
1.3 pour cent avec un taux maximum observe de 1.6 pour 
cent. Les taux de refus au niveau provincial sont ordinairement 
du méme ordre de grandeur mais ils peuvent descendre aussi 
bas que 0.8 pour cent ou monter aussi haut que 2.0 pour cent. 


Erreur de réponse 


Cette erreur peut etre attribuable a la conception du 
questionnaire, a la formulation des questions, a l’attitude du 
repondant, a la facon dont l’interview est menée ainsi qu’au 
conditions génerales dans lesquelles l’enquete est realisee. 
Les erreurs de réponse peuvent se produire au moment ou 
l'on demande les renseignements ou au moment ou les 
renseignements sont fournis, recus ou inscrits. Le répondant 
peut mal interpréter la question, ne pas savoir la réponse, 
avoir oubliée ou preferer communiquer une distotion des faits 
pour des raisons qui luli sont propres. De plus, il arrive que les 
differents intervieweurs aient tendance a expliquer les 
réponses ou a les interpréter de maniere différente. Les 
erreurs de reponse, comme les autres categories d’erreurs, 
peuvent avoir une variance et un biais. Le Programme de 
reinterview, dont il sera question a la section 9.5, fournit des 
estimations de la variance de réponse et du biais de 
réponse. 


Les réponses par procuration, que |’on obtient lors- 
qu'on recueille aupres d'un membre du menage des 
renseignements se rapportant a un autre membre, peuvent 
aussi entrainer des erreurs de réponse. 


Dans les enquétes repétées, ou |’echantillon est constitué 
d’un certain nombre de panels indépendants ou groupes de 
renouvellement, l’esperance mathematique des estimations 
varie legerement d'un groupe de renouvellement a un autre. Il 
se produit alors ce qu’on appelle un biais de renouvel- 
lement. En ce qui concerne |'EPA, ce biais atteint son plus 
haut niveau pour le sixieme de |’echantillon qui en est a sa 
premiere interview. Cependant, le mode de renouvellement 
choisi, selon lequel les cing sixiemes de |’échantillon ne 
changent pas d'un mois a |’autre, fait en sorte que le biais de 
renouvellement est réeduit au maximum. On peut obtenir 
"indice de renouvellement en faisant le rapport entre une 
estimation calculee pour la partie de |’échantillon participant a 


the estimate calculated from ail the sa 

mple. Average 
index values and estimated standard ls for fe 
saat oo March 1985 to February 1988 for the three 
main labour force characteristics at the Cc 

are shown in the table. a at 


Rotation group bias in the LFS for earlier periods 
was studied by Tessier (1976) and Ghangurde (1982) 
following a study by Bailar (1975) of rotation group bias 
in the American Current Population Survey. 


Average rotation group index : March 1985 - 
February 1988 P 
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'enquete pour un certain nombre de fois (premier mois, 
deuxieme, etc.) et l'estimation calculée pour |’échantillon 
entier. Le tableau qui suit présente la valeur des indices 
moyens, ainsi que les erreurs types estimées, pour les trois 
principales caractéristiques de la population active en ce qui 
concerne la période allant de mars 1985 a fevrier 1988 
(Canada). 


Le biais de renouvellement de l’EPA a été étudié aupa- 
ravant par Tessier (1976) et Ghangurde (1982). Ces travaux 
faisaient suite a l'étude produite par Bailar (1975) portant sur 
le biais de renouvellement sur l'enquéte de la population 
active des Etats-Unis (American Current Population Survey). 


abe g de renouvellement moyen : mars 1985 - feévrier 


Characteristic Month in Sample -— Mois de participation a l’enquéte 
; First Second Th 

Garandnstqus ird Fourth Fifth Sixth 
Premier Deuxieme Troisieme Quatrieme Cinquieme Sixieme 

Employed — Pers. occupées 0.9745 1.0091 1.0102 1.0070 1.0028 0.9963 
0.0040 0.0036 0.0037 0.0038 0.0038 0.0036 

Unemployed —- Chomeurs 0.9839 1.0271 1.0195 1.0065 0.9963 0.9668 
0.0055 0.0065 0.0068 0.0066 0.0060 0.0063 

Not in labour force - 0.9779 1.0068 1.0063 1.0073 1.0017 0.9999 

Inactifs 0.0027 0.0027 0.0028 0.0026 0.0026 


Processing error. Processing errors may occur 
at various stages such as data entry, editing, coding, 
weighting and tabulation. 


During the data capture operation in the regional 
offices, a sample of LFS forms is verified to monitor 
and control data entry quality. The method involves the 
verification (independent re-capture and matching) of a 
sample of the documents selected from a lot which 
was processed by a data entry operator. If the number 
of verified records in the sample that contain one or 
more data entry errors is not greater than a pre- 
specified acceptance number, then the lot is accepted. 
If the number of error records is greater than this 
number, then the lot is rejected and the remainder of 
the lot is completely verified. Two measures of the 
effectiveness of this control process are the Verifica- 
tion Rate, which is the percentage of records that 
were verified for all lots, and the Average Outgoing 
Quality, which is an estimate of the percentage of 
records which contain data entry errors after the 
application of the quality control process. Some typical 
Average Outgoing Quality levels for the eight regional 
offices and Canada are shown in the table. 


A separate, similar sample verification procedure 
is used to control the quality of the coding operations 
during the processing stage. Errors in the survey data 
at the estimation and tabulation stage are controlled 
through a detailed review of the output, Comparison 
with other data sources and checks for redundancy. 


Erreur de traitement. Ces erreurs peuvent se produire a 
diverses étapes du traitement, soit a la saisie, a la verification, 
au codage, a la ponderation ou a la totalisation des donnees. 


Pendant l’opération de saisie des donnees aux bureaux 
regionaux, on prend un echantillon de formules de |'EPA pour 
surveiller et controler la qualité de cette operation. La facon 
dont on procede consiste a verifier le travail effectue par un 
preposeé a la saisie des données en prenant dans un lot un 
echantillon de formules, en introduisant les donnees a 
nouveau et en comparant le resultat avec celui obtenu la 
premiere fois. Si, dans l’échantillon, le nombre d’enregistre- 
ments verifies contenant au moins une erreur de Saisie ne 
dépasse pas un seuil établi d’avance, le lot est accepte. Si le 
nombre d’enregistrements errones depasse le seuil, le lot est 
rejete et tous les autres enregistrements du lot sont soumis a 
la veérification. Les deux mesures utilisées pour connaitre 
l'efficacite de ce processus de controle sont le taux de veri- 
fication, qui est le pourcentage d’enregistrements verifies sur 
l'ensemble des lots, et la qualité moyenne de la sortie 
(QMS), qui est une estimation du pourcentage d’enregistre- 
ments contenant encore des erreurs de saisie apres le 
controle de la qualité. Le tableau qui suit indique quelques 
valeurs typiques obtenues pour les huit bureaux régionaux et 
le Canada. 


On procéde a une verification par echantillon distincte 
mais semblable pour contrdler la qualite des operations de 
codage. Pour detecter les erreurs susceptible de se produire 
a l’étape de l’estimation et de la totalisation, on procede a un 
examen soigne du resultat de ces operations, a une com- 
paraison avec d'autres sources de données et a un controle 
par redondance. 


Average Outgoing Quality: July 1988 - December 
1988 
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Qualité moyenne de la sortie : juillet 1988 - decembre 
1988 


Regional Office High Low Average 
Bureau regional Maximum Minimum Moyenne 
St. John’s 1.0 0.3 0.6 
Halifax lec 0.5 0.9 
Montreal 0.9 0.4 0.7 
Sturgeon Falls We 0.7 1.0 
Toronto 1.4 0.6 1.0 
Winnipeg 1.0 0.7 0.8 
Edmonton 18} 0.6 1.0 
Vancouver AG: ONS : 0.8 
Canada We 0.9 1.0 


9.5 Data Collection Quality 


The LFS incorporates a number of measures 
designed for the assessment and control of non- 
sampling errors that occur in the collection stage of the 
survey. 


Hiring Practices 


Prior to being hired as interviewers, applicants are 
evaluated on such aspects as aptitude and ability to 
deal with the materials used on the job. Before training 
starts, new interviewers are sent copies of "“Intro- 
duction to Interviewing" and "Statistics Canada and 
You". These booklets introduce the job of LFS 
interviewer and the organization of Statistics Canada. 


Training 


Initial training of interviewers is spread over a two- 
month period. It begins with a three-day classroom 
training session, during which interviewers receive 
practical instruction in filling out the different survey 
and administrative forms. As well, they complete 
practice exercises, listen to interviews on tape, perform 
mock interviews and receive guidance in interviewing 
techniques. 


During the interviewers’ first survey week they 
receive two days of on-the-job instruction and one day 
of this instruction during the second survey. During this 
time they are accompanied by the senior interviewer, 
who observes and guides the interviewing as well as 
demonstrates actual interviews. To keep the inter- 
viewers’ skills fresh, special training and refresher 
courses are given at least once a year during a group 
training session. 


The work of the interviewers is assessed as a 
result of other programs which will be described below. 
Depending on the interviewer’s performance, additional 
home study and review exercises may be assigned to 
clarify or reinforce weak points. 


9.5 Qualité de la collecte des données 


L’'EPA prévoit un certain nombre de mesures visant a 
évaluer les erreurs non dues a |’échantillonnage qui se pro- 
duisent pendant la collecte des données et a en limiter le 
nombre. 


Recrutement 


Avant d’embaucher les candidats a des postes d’inter- 
vieweur, on évalue leurs aptitudes et leur capacité a bien 
remplir les documents de |l’enquéete. Avant meme que la 
formation ne commence, on leur envoie un exemplaire des 
documents "Initiation aux interviews” et "Statistique Canada 
et vous". Ceux-ci présentent le travail des intervieweurs de 
EPA et décrivent l’organisation de Statistique Canada. 


Formation 


La période initiale de formation des intervieweurs s’étend 
sur deux mois. Elle commence par un cours de trois jours, en 
classe, pendant lequel on montre aux intervieweurs qui vien- 
nent d’étre embauchés comment remplir les formules d’en- 
quéte et les documents administratifs. En outre, ces derniers 
y font des exercices pratiques, ecoutent des interviews enre- 
gistrees, en simulent eux-memes et apprennent les techni- 
ques d interview. 


Ensuite, les intervieweurs recoivent deux jours de 
formation en milieu de travail pendant la premiere semaine 
d’enquéte a laquelle ils travaillent et un jour pendant la 
deuxieme. Pour cela, |’intervieweur principal les accompagne: 
il les observe et leur indique comment mener les interviews et 
leur donne l’exemple en en menant lui-méme. Les _ inter- 
vieweurs participent egalement a des seances speciales de 
formation et de recyclage, en groupe, au moins une fois par 
an. 


Le travail des intervieweurs est évalué dans le cadre 
d'autres programmes, qui seront décrits plus loin. Selon le 
rendement de chacun, on détermine s'il y a lieu d’ajouter des 
cours d’autoformation ou des exercices de revision pour 
éeclaircir certains points ou remédier a des faiblesses. 


Observation 


. The observation program is designed to minimize 
interviewer error by providing the senior interviewer 
with the opportunity to observe and assess the 
performance of the interviewers they supervise and to 
identify any problems. Each interviewer is observed at 
least once every 12 months. The scheduling and 
selection of interviewers to be observed is done by the 
regional offices, thus ensuring there is no conflict with 
the re-interview program and no identifiable pattern. 
The senior interviewer accompanies the interviewer for 
one day, observing any face-to-face and telephone 
interviews. A check of cluster listings is performed on a 
second day. Results of observation are sent to ROs by 
the senior interviewers and_ periodic reports are 
prepared for Head Office. The interviewer receives 
feedback on his or her performance from the senior 
interviewer as soon as possible after the observation. 


Re-interview 


Each month, except for December, a number of 
dwellings in the LFS sample are chosen for the re- 
interview program. This sub-sample is selected so that 
each interviewer will have a part of his or her 
assignment re-enumerated at least twice each year. 


The re-interview is conducted by telephone by RO 
supervisory staff or senior interviewers in the week 
following survey week. The re-interviewer conducts a 
second interview in selected dwellings, making 
allowance for the fact that the reference week is now 
two weeks prior to re-interview week. 


The re-interview sample is divided into two parts: 
the reconciled part and the non- reconciled part. In the 
reconciled part, after the second interview, the senior 
interviewer compares answers with those that were 
obtained by the original interviewer, and with the help 
of the respondent, determines the "correct" answer. In 
the non-reconciled part, the senior interviewer simply 
conducts a second independent interview. The 
reconciled sample data are used to obtain measures of 
response bias, the assumption being that the same 
error will not be made by both interviewer and re- 
interviewer and that the reconciliation process will 
uncover the true response. Data from the non- 
reconciled part of the re-interview sample are used to 
estimate response variance. The reconciled part also 
gives the senior interviewer the ability to monitor the 
interviewer's performance. After re-interview, the senior 
interviewer discusses discrepancies with the  tnter- 
viewer, offering guidance and identifying the items 
most susceptible to error. 


A measure of bias is the net difference rate. For 
a characteristic such as "employed", it is defined as 


[no. of employed in original interview — 
no. of employed in re-interview | /n 
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Observation 


Le programme d’observation vise a réduire au maximum 
les erreurs que les intervieweurs pourraient commettre en 
donnant a |'intervieweur principal l'occasion d'observer ceux 
qui relevent de lui, d’évaluer leur rendement et de déceler les 
problemes. Chaque intervieweur est observé au moins une 
fois tous les douze mois. C’est au bureau régional qu'on 
decide qui sera observe et quand, de maniére a ce qu'il n'y ait 
pas de conflit avec le programme de réinterview et qu'on ne 
puisse pas deviner |’ordre dans lequel le programme d’'obser- 
vation se déroule. L'intervieweur principal accompagne |'inter- 
vieweur pendant toute une journée et voit comment se 
passent les interviews sur place et les interviews télepho- 
niques. Le deuxiéme jour, il vérifie les listes de grappe. Il 
envoie ensuite les résultats de l’observation au BR et rédige 
des rapports périodiques a |'intention du bureau central. 
L’intervieweur principal transmet a l'intervieweur le résultat de 
sa performance aussitot que possible apres l’observation. 


Réinterview 


Chaque mois, sauf en décembre, on choisit un certain 
nombre de logements dans |'echantillon de IEPA pour le 
programme de reinterview. Ce sous-éechantillon est preleve de 
maniere a ce qu'un partie de la tache de chaque intervieweur 
soit reinterviewee au moins deux fois par an. 


Les surveillants au BR, ou les intervieweurs principaux, 
procedent a la reinterview par telephone dans le courant de la 
semaine suivant la semaine d’enquete. Il le font pour les 
logements choisis en tenant bien compte du fait que la 
semaine de reference a eu lieu deux semaines auparavent. 


L’echantillon constitué pour la reinterview est diviseé en 
deux parties. Pour l'une, l'intervieweur principal compare les 
reponses obtenues a la seconde interview avec celles fournies 
la premiere fois a l’intervieweur et, s'il y a des differences, 
determine avec l'aide du repondant quelle est la bonne 
reponse. Pour l'autre partie de l’echantillon, l'intervieweur 
principal se contente de mener une interview independante. 
On se sert des données recueillies aupres de la partie de 
l'echantillon qui a fait l'objet de la comparaison pour obtenir 
une mesure du biais de réponse, |’hypothese étant que 
lintervieweur et l'intervieweur principal ne feraient pas les 
memes erreurs et que la comparaison permet de découvrir les 
bonnes reponses. On se sert des données recueillies aupres 
de la partie de |’échantillon qui n'a pas fait l'objet de la com- 
paraison pour estimer la variance de réponse. La compa- 
raison des reponses permet aussi a |'intervieweur principal de 
vérifier le travail des intervieweurs. Apres la reinterview, 
l'intervieweur principal commente, avec les intervieweurs, des 
divergences obtenues dans les resultats, il leur donne des 
conseils et leur signale les questions auxquelles on associe le 
plus grand nombre d’erreurs. 


Le taux d’éecart net mesure le biais. Pour une carac- 
téristique Comme "personne occupee", on le definit de la 
maniere suivante : 


{nbre de personnes occupées a la premiére interview — 
nbre de personnes occupées 4a la réinterview]/n 


and is based on the n individuals in the reconciled 
sample. If the net difference rate is negative, then the 
LFS estimation procedure is likely to produce under- 
estimates for the characteristic. 


The response variance for a characteristic such as 
"employed" is defined as the number of respondents 
classified as employed in only one interview, divided 
by twice the sample size. The index of incon- 
sistency is a measure of relative response variance. It 


is defined as the percentage of total variance 
accounted for by the response variance, 1.é., 
response variance 
x 100 


response variance + sampling variance 


and is based on the non-reconciled sample. 


The following table gives average net difference 
rates and indices of inconsistency for the period from 
1980 to 1986. 


% Net Difference Rate and % Index of 
Inconsistency by Labour Force Status 
1980-1986 Averages 
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selon les données recueillies aupres de la partie de 
l'6chantillon qui a fait l'objet de la comparaison. Si le taux 
d’écart net est négatif, il est probable que les estimations 
produites par la méthode de |’EPA soient inferieures a ce 
qu’elles devraient étre. 


La variance de réponse pour une caractéristique comme 
"personne occupée" est calculée de la maniere suivante : 
nombre de répondants classes dans la categorie des 
personnes occupées apres une interview seulement divise par 
le double de la taille de |’échantillon. L'indice de non- 
coherence est une mesure de la variance de reponse 
relative. Elle est définie comme etant le pourcentage de la 
variance totale representé par la variance de reponse, c’est-a- 
dire : 


variance de réponse 
x 100 
variance de reponse + variance d’echantillonnage 


et elle est basée sur la partie de |’échantillon qui n’a pas fait 
objet de la comparaison. 


Le tableau suivant donne les taux d’écart net et les 
indices de non-cohérence pour la période 1980-1986. 


Taux d’écart net et indice de non-cohérence 
selon la situation vis-a-vis de l’activite, moyennes 


pour 1980-1986 


% Net Difference Rate 


Taux d’écart net 


% Index of Inconsistency 


Indice de non-coherence 


Employed — Personnes occupees -0.28 
Unemployed - Chdomeurs -0.28 
Not in Labour Force — Inactifs 0.56 


(-0.5 to 0.1) S.02)  (4tO7) 
(-0.4 to -0.1) 24.07 (20 to 32) 
(0.4 to 0.8) pals le WON TIab) 


Note: Numbers in brackets give the range of typical values during the seven-year period. 
Nota: Les nombres entre parentheses indiquent | intervalle des valeurs les plus courantes pendant la periode observee. 


An index below 20 percent is considered low, one 
between 20 percent and 50 percent is moderate, and 
one greater than 50 percent is high. 


Performance Feedback 


In addition to the programs described above, 
monthly reports on performance are provided to the 
ROs. These deal with costs, edit failure rates and 
response rates. Senior interviewers maintain regular 
contact with their interviewers. They bring to the 
interviewer's attention results of the various perfor- 
mance indicators. 


9.6 Operations and Analysis 


As indicated in Chapter 7, four committees meet 
regularly to coordinate the operations of the LFS. The 
Redesign Committee is active only when the LFS is 
being redesigned. The other three committees deal 
with the ongoing operations and evaluation of the 
survey. 


On estime qu'un indice inférieur a 20% est faible, qu'un 
indice entre 20 et 50% est moyen et qu’un indice supérieur a 
50% est éleve. 


Rétroaction sur le rendement 


En plus des programmes décrits ci-dessus, le rendement 
des intervieweurs fait l'objet de rapports mensuels aux BR. 
Ces rapports ont trait aux couts, aux taux de rejet a la 
vérification et aux taux de reponse. Les intervieweurs princi- 
paux sont régulierement en contact avec leurs intervieweurs, 
et ils portent a leur attention les résultats des divers indi- 
cateurs du rendement. 


9.6 Operations et analyse 


Comme nous |’avons vu au chapitre 7, plusieurs comites 
se réunissent régulierement pour coordonner les opérations 
de |'EPA. Le Comité du remaniement est actif uniquement 
pendant le remaniement de |’EPA. Les trois autres s’occupent 
des operations permanentes et de |’évaluation de |’enquéte. 


Operations Committee 


The mandate of the Operations Committee is to 
review the events of survey months and the cir- 
cumstances under which the Surveys were undertaken 
to ensure successful operation and to review and 
recommend proposals for changes to the operations, 


which will result in the continued successful conduct of 
the survey. 


Content Consultation Group 


The mandate of the Content Consultation Group is 
to act as the focal point for the resolution of issues 
concerning the subject matter (labour market concepts) 
of the questionnaire, interviewer training materials, and 
reference documents such as manuals and communi- 
cations on the subject matter of the LFS 


Data Quality Committee 


The mandate of the Data Quality Committee is to 
examine and evaluate survey quality on a monthly and 
longer-term basis, to initiate and review proposals for 
research and development of methods and procedures 
affecting data quality and to oversee quality oriented 
research and development. 


To ensure the highest possible quality in the data 
from the LFS, the various quality indicators described 
above are monitored regularly by the Data Quality 
Committee. Each month this committee meets to 
examine and evaluate monthly survey quality and to 
advise on any aspect of quality that needs attention. To 
assist in this evaluation, a monthly operations report is 
compiled, which includes such quality indicators as 
non-response, discrepancy rates (errors in data 
detected during editing), slippage, re-interview non- 
response, interviewer turnover, and sample verification 
rates. By monitoring these indicators, immediate feed- 
back to one or more specific LFS operations can be 
provided to control quality on a survey-to-survey basis. 
The committee also discusses developments that may 
affect data quality for the survey just completed or for 
future surveys. Examples include changes in collection 
methodology or in the questionnaire, unusual field 
problems, ongoing programs of testing procedures and 
methodology, etc. 


Another regular and more detailed report, the LFS 
Quality Report, is also produced. This report Is 
intended to provide an in-depth review of the quality 
measures associated with the LFS (including measures 
of sampling error) for a six-month period. 
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Comité des opérations 


Ce comité a pour mandat de passer en revue les événe- 
ments survenus pendant les mois d’enquéte et les circons- 
tances entourant la tenue de l’enquéte, de voir a ce que les 
operations se déroulent bien, d’examiner les changements 
proposes et d’en recommander |'adoption, le tout afin que 
l'enquéte continue a atteindre ses objectifs. 


Groupe de consultation sur le contenu 


Ce comité a pour mandat de coordonner le réglement des 
problemes touchant le sujet du questionnaire (les concepts 
relatifs au marche du travail), les documents pour la formation 
des intervieweurs ainsi que les documents de référence 
comme les manuels et enfin les communications sur le sujet 
dont traite EPA. 


Comité de la qualite des données 


Ce comité a pour mandat d’examiner et d’évaluer la 
qualite des données d’enquéte sur une base mensuelle, de 
proposer et de reviser des projets de recherche et de 
développement visant la mise au point de méthodes pouvant 
influer sur la qualité des données, et enfin de surveiller la 
recherche et le developpement dans ce domaine. 


Pour s’assurer que la qualité des données de |’EPA soit la 
meilleure possible, le Comite de la qualite des donnees con- 
sulte regulierement les divers indicateurs de la qualite men- 
tionnes plus haut. Il se réunit tous les mois afin d’examiner et 
d’évaluer la qualite des données mensuelles et d’émettre son 
opinion sur tout aspect touchant la qualite des donnees devant 
etre ameliore. Un rapport mensuel sur les opérations est 
redigé pour l’aider dans cette tache. Ce rapport contient des 
indicateurs de la qualité comme les taux de non-reponse, de 
divergence (erreurs dans les donnees relevees au moment de 
la verification), de glissement, de non-reponse a la reinterview, 
de roulement des intervieweurs et de _ verification par 
échantillon. En suivant de pres |’évolution de ces indicateurs, 
le Comite peut intervenir immediatement aupres des respon- 
sable de la ou des opérations de |’EPA concernees afin que 
l'on puisse controler la qualite des donnees chaque mois. Le 
Comité discute egalement des faits nouveaux susceptibles 
d'influer fa qualite des données qui viennent juste d’étre 
recueillies ou qui le seront a l’avenir, notamment des change- 
ments apportes aux methodes de collecte ou au question- 
naire, des problemes inhabituels sur le terrain, de la mise a 
l'essai continue de procédures et de methodes, etc. 


Un autre rapport, plus detaillé, est produit regulierement, 
le Rapport sur la qualite de I'EPA. Celui-ci contient un 
examen en profondeur des mesures de la qualite associees a 
EPA (y compris des mesures de l’erreur d’echantillonnage) 
sur une période de six mois. 
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Chapter 10 


General Use of the Labour Force 
Survey Vehicle 


10.1 Introduction 


In addition to supplying the monthly labour market 
data requirements of Statistics Canada, the LFS is 
used to collect data for various studies of the general 
population and for specific subsets of the population. 
This is achieved through special surveys and supple- 
mentary surveys. Special surveys consist of special 
samples of dwellings chosen from dwellings not 
sampled for the LFS but selected from areas sampled 
by the LFS. Supplementary surveys consist of 
additional questions asked of LFS respondents at the 
time of the LFS interview, although in some cases the 
supplementary questionnaires are dropped off at the 
household and collected later. 


Special and supplementary surveys are often 
sponsored by other government departments. By 
using the LFS sample, the cost of conducting a large 
scale survey, whether ad-hoc or periodic, can be 
greatly reduced. In addition to having the survey 
vehicle already in place, all the information regularly 
collected on the Household Record Docket (Form 03) 
and LFS Questionnaire (Form 05) is automatically 
available for both screening (i.e., identifying a target 
population, such as persons in a particular age group) 
and analysis. 


10.2 Special Surveys 


Examples of recurring special surveys include the 
Food Expenditure Survey and the Family Expenditure 
Survey. The former is a monthly sample survey, 
usually conducted during even numbered years, in 
which respondents are required to complete a diary of 
food expenditures. The latter, occuring in odd 
numbered years, is conducted two months after the 
completion of the food survey and consists of a recall 
of full budget expenditures for the preceding calendar 
year. Random starts from the same clusters as the 
LFS are reserved for these surveys. In this way the 
sample households are different from those used in the 
LFS although they are selected from already active 
clusters and PSUs, so that local LFS interviewers can 
be used. This is the most economical means of 
selecting a separate sample from the LFS frame. 


However, special surveys need not be selected 
from active LFS clusters and PSUs. Different PSUs can 
be set aside for the special survey, usually from a part 
of the frame that is not to be selected for the LFS for 


Chapitre 10 


Utilisation de l’enquéte sur la population 
active pour la realisation d’autres enquétes 


10.1. Introduction 


Statistique Canada, en plus de se servir de |’EPA pour 
produire les données mensuelles nécessaires sur le marché 
du travail, a recours a cette enquéte pour recueillir des 
donnees sur divers aspects de la population dans son 
ensemble ainsi que de certains sous-groupes de la population. 
Les enquétes spéciales sont menées auprés d’échantillons de 
logements choisis parmi les logements qui n’ont pas été 
sélectionnés pour |I'EPA mais qui se trouvent dans des 
secteurs echantillonnes pour IEPA. Les enquétes supple- 
mentaires sont menées au moyen de questions rajoutées a 
celle de |'EPA et posées aux enquétés au moment ou on les 
interview pour cette enquéte, quoiqu’il arrive qu’on laisse au 
menage un questionnaire supplémentaire, qu'on revient 
chercher plus tard. 


Les enquétes spéciales et supplementaires sont souvent 
parrainées par d'autres ministeres ou organismes publics. Le 
cout d’une grande enquéte, ponctuelle ou périodique, peut 
étre considérablement reduit si l’on se sert de |’échantillon de 
EPA. En plus d’avoir toute la structure en place, on dispose 
du méme coup de tous les renseignements recueillis pour 
creer le dossier du menage (formule 03) et remplir le 
questionnaire de |’'EPA (formule 05), lesquels peuvent étre 
utilises a des fins de preselection (c’est-a-dire pour mettre en 
evidence la population cible : les personnes appartenant a un 
groupe en particulier) et d’analyse. 


10.2 Enquétes speciales 


L’enquéte sur les dépenses alimentaires et l'enquete sur 
les dépenses des familles sont deux enquétes speciales 
périodiques. La premiere est une enquéte par sondage 
mensuelle, qui a géneralement lieu les années paires et pour 
laquelle on demande aux repondants de tenir un journal ou ils 
doivent noter toutes leurs depenses alimentaires. La deuxieme 
a lieu les années impaires, deux mois apres la fin de |’enquete 
sur les dépenses alimentaires, et elle consiste a demander 
aux répondants de se rappeler toutes les dépenses bud- 
gétaires effectuees l'année precedente. On reserve a ces 
deux enquétes des origines choisies au hasard dans les 
memes grappes que celles qui sont echantillonnees pour 
EPA; ainsi, les menages choisis ne sont pas les memes que 
ceux qui participent a I'EPA, mais ils proviennent de grappes 
et d'UPE qui sont déja actives, de sorte qu’on peut prendre 
des intervieweurs des memes regions. Il s’agit la de la facon 
la plus économique de prélever un échantillon distinct dans la 
base de |’EPA. 


ll n'est toutefois par necessaire que l’echantillon des 
enquétes spéciales soit preleve dans les grappes et les UPE 
actives. ll est possible de reserver a ces enquetes certaines 
UPE, qui se trouvent dans une partie de la base de sondage 


many years, if ever. An example of such a survey was 
the sample for the Canada Health Survey. For this 
survey there was a requirement for clustering of the 
sample, different from the regular LFS, due to the 
relatively costly health measures component. 


10.3. Supplementary Surveys 


Supplementary surveys are directed at more 
detailed information on some aspects of the labour 
market that are required only periodically, and a 
capacity for obtaining data of special interest which are 
not normally produced as part of the national statistical 
program of Statistics Canada. As well, the data or the 
ability to obtain them may not be easily available 
elsewhere. The latter type of special survey is fre- 
quently sponsored by other government departments. 


10.3.1 Examples of Supplementary Surveys 


Household Surveys’ Division itself sponsors 
supplementary surveys dealing with labour market 
related topics, selected largely on the basis of user 
interest, such as Annual Work Patterns, Job 
Opportunities and, during the summer months, the 
identification of students returning to school in the fall. 


Outside sponsorship has included surveys on 
topics such as Fitness and Physical Recreation, 
Domestic Travel, Child Health, Work History, Appren- 
ticeship and Smoking Habits. Several design options 
for supplementary surveys exist, which are outlined 
below. Examples of of special and supplementary 
surveys, using the LFS vehicle in 1988, are found in 
section 10.4. More information on special surveys 
conducted by Statistics Canada is found in the yearly 
uncatalogued publication "Overview of Special 
Surveys". 


10.3.2 Sample Selection Options 


Each rotation group of the LFS can be used to 
produce representative statistics at the Canada level 
and for each of the provinces. Depending on the level 
of reliability necessary to satisfy statistical require- 
ments, from one to six rotation groups can be used to 
provide supplementary survey estimates. Normally, 
however, no more than five rotations are used. The 
rotation group being introduced into the sample for the 
first time is avoided because of the time-consuming 
interview workload already required at the first 
interview. 


If a smaller sample is desired than a whole 
multiple of a rotation group, the stabilization program is 
used to reduce the number of selected dwellings, and 
the dwelling weights are adjusted accordingly. 


Within a selected dwelling, the supplementary 
survey may be directed at all eligible Labour Force 
Survey respondents or specific individuals. Separate 
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ou l’on ne prélévera plus d’unités pour |’EPA, ou alors pas 
avant plusieurs années. L’enquéte Sante Canada est une des 
enquétes pour lesquelles on a procédé de cette maniere. | 
fallait constituer les grappes autrement que pour I'EPA en 
raison du cout éleve de la composante sur les mesures de 
sante. 


10.3. Enquétes supplementaires 


Les enquétes supplementaires sont concues pour 
recueillir des données détaillees sur certains aspects du 
marche du travail dont on n’a besoin que périodiquement et 
pour produire des données d’intérét particulier qui ne sont pas 
normalement produites dans le cadre du programme national 
de Statistique Canada. En outre, il est possible que personne 
d’autre n’ait ces données ni la capacité de les produire. Les 
enquétes spéciales ayant le second objectif sont souvent 
parrainées par des ministeres ou organismes publics. 


10.3.1 Exemples d’enquétes suppléementaires 


La Division des enquétes-ménages parraine elle-méme 
des enquétes supplémentaires sur des sujets qui ont trait au 
marche du travail et qui intéressent les utilisateurs, comme 
l’enquéte sur l’activité annuelle, l’enquéte sur les perspectives 
d’emploi et l'enquéte, menée en éte, sur les etudiants ayant 
intention de retourner aux études en automne. 


Parmi les enquétes parrainées par des organismes autres 
que Statistique Canada, mentionnons les enquétes sur 
l’exercice physique et les activites physiques et sportives, les 
voyages des Canadiens, la santé des jeunes, l’activité, les 
apprentis et les habitudes de fumer. Il existe plusieurs possibi- 
lites de plans de sondage pour les enquétes supplémentaires, 
et celles-ci sont décrites brievement plus bas. Des exemples 
d’enquétes spéciales et d’enquétes supplementaires menees 
au moyen de |’EPA en 1988 sont donnés a la section 10.4. La 
publication annuelle "Apercu des enquétes spéciales", qui ne 
figure pas au catalogue, contient plus de details sur les 
enquétes spéciales réalisées par Statistique Canada. 


10.3.2 Possibilites de plans de sondage 


Chaque groupe de renouvellement de |’EPA est un 
échantillon indépendant a partir duquel il est possible de 
produire des statistiques representatives a l’échelle du 
Canada et de chaque province. Selon le degre de fiabilité qu'il 
faut atteindre pour satisfaire aux exigences statistiques, on 
peut prendre d’un a six groupes de renouvellement pour 
produire les estimations des enquétes spéciales. Cependant, 
en général, on n’en prend pas plus de cing. On eévite le 
groupe de renouvellement qui vient d’étre introduit dans 
’6chantillon parce que la premiere interview de |'EPA prend 
déja beaucoup de temps. 


Si on veut un échantillon plus petit que celui qu’on 
obtiendrait en prenant un multiple entier du nombre de 
groupes de renouvellement, on a recours au programme de 
stabilisation pour réduire le nombre de logements choisis et 
on modifie le poids des logements en consequence. 


Au niveau des logements eéchantillonnés, |’enquéte 
supplementaire peut s’adresser a tous les membres admis- 
sibles selon les criteres de |’enquéte sur la population active 


individual respondents may be selected from within 
selected dwellings through random. selection or by 
screening for respondents with specific demographic 
or labour force characteristics from the LFS documents 
or through special questions. 


10.3.3 Data Collection Methodologies 


Depending on the length and complexity of the 
Survey, a number of different data collection 
methodologies can be employed. The traditional 
method is a personal interview completed at the time 
of the regular LFS enumeration. Generally, one page of 
additional questions can be accommodated using this 
approach. These single page supplements (Form 06) 
can accommodate from 15 to 25 questions which the 
interviewer will ask after completing the LFS Question- 
naires for all household members. 


When supplementary surveys are long and 
complex or require self-enumeration (i.e., when proxy 
reporting is not appropriate), a separate questionnaire 
may be distributed by mail or left with respondents at 
the time of the regular LFS interview. For telephone 
respondent households, arrangements are made for 
the enumerator to deliver or mail out the documents. 
Documents are either picked up by enumerators, at 
which time they may or may not offer assistance in 
completing forms, or they are returned by mail. 


The Household Record Docket may be used for 
recording the answers to about five very brief and 
straightforward questions. This area may be used for 
supplementary data or for recording results of 
screening questions. 


10.3.4 Acceptability Criteria for Supplementary 
Surveys 


The effect of a supplementary survey on 
respondents is a primary concern. Topics or questions 
that are likely to be unacceptable to respondents, or to 
influence in some way responses obtained for the LFS 
in the following month, are avoided. Supplements must 
comply with Statistics Canada criteria for reliability of 
data and confidentiality of responses. In general, 
supplements appear to be well-received; they increase 
interviewing time, but on the other hand, also add 
variety to the experience of being included in the LFS 
sample for six months. 


10.4 Examples 


The following table lists the special and 
supplementary surveys which were conducted in the 
1988 calendar year. Indicated are the name of the 
survey, the month it was conducted, the method ‘i 
collection (personal interview, telephone interview, se 
enumeration by mail) and the number of rotation 


groups that were used. 


99 


Ou a Certaines personnes en particulier. II s'agit alors soit de 
prélever un échantillon aléatoire d’individus a l'intérieur des 
menages choisis soit de faire une présélection en consultant 
les documents de I|'EPA ou en posant certaines questions afin 
de retenir les répondants ayant certaines caractéristiques du 
point de vue démographique ou du point de vue de I'activite. 


10.3.3 Méthodes de collecte des données 


ll est possible d’utiliser différentes méthodes de collecte 
des données, dont le choix dépend de la durée et de la 
complexite de l’enquéte. La méthode habituelle consiste a 
donner des interviews sur place en méme temps que celles 
de l'EPA. En’géneral, on peut ajouter une page de questions 
si l'on utilise cette methode. Cette page supplementaire 
(formule 06) peut contenir de 15 a 25 questions, que 
l'intervieweur peut poser a tous les membres du menages 
apres celles de |’EPA. 


Lorsqu'une enquete supplémentaire est longue et 
complexe ou qu'elle exige que les enquetes repondent eux- 
memes aux questions (c’est-a-dire qu'on n’accepte pas de 
reponses par personne interposee), on peut envoyer un 
questionnaire distinct par la poste ou le remettre aux 
répondants au moment de l’interview de |'EPA. Dans le cas 
des meénages qui font l'objet d’une interview telephonique, on 
prend les dispositions necessaires pour que ce_ soit 
lintervieweur qui poste ou dépose le questionnaire. Celui-ci 
est soit repris par l’intervieweur, qui peut alors offrir de l'aide 
aux répondants s'ils ont du mal a le remplir tout seuls, soit 
renvoye par la poste. 


On peut noter dans le dossier du ménage les reponses a 
environ cinq questions tres breves et directes. Il peut s'agir 
de questions par lesquelles on cherche a obtenir des donnees 
supplémentaires ou de questions de selection. 


10.3.4 Criteres d’admissibilite relatifs aux enquétes 
supplementaires 


L’effet qu'une enquéte supplementaire est susceptible 
d'avoir sur les repondants est une preoccupation primordiale. 
On évite les sujets ou les questions que ces derniers 
pourraient trouver inacceptables ou qui pourraient influencer le 
déroulement des interviews de I'EPA le mois suivant. Par 
ailleurs, les enquétes supplementaires doivent se conformer 
aux criteres de Statistique Canada en matiere de fiabilite et de 
confidentialite des données. Dans l'ensemble, elles semblent 
étre bien accueillies; il est vrai qu’elles prolongent l’interview, 
mais en revanche elles introduisent un element de variete 
apprecié par les repondants qui participent a |'EPA pendant 
six mois. 


10.4 Exemples 


Le tableau qui suit contient la liste des enquétes 
suppléementaires et speciales menees pendant !l'annee civile 
1988. ll indique le nom des enquétes, le mois ou elles ont eu 
lieu, la méthode de collecte de donnees utilisee (interview sur 
place, interview telephonique ou questionnaire envoye par la 
poste) et le nombre de groupes de renouvellement utilises. 


1988 Special and Supplementary Surveys 
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Enquétes spéciales et suppléementaires - 1988 


Survey 


Enquete 


Method 


Méthode 


Size 


Taille 


Labour Market Activity — Activite 


Importance of Wildlife to Canadians - 
Importance de la faune 


Absence from Work - Absence du travail 
Shelter Cost - Frais de logement 
Job Opportunities — Perspectives d'emploi 


Consumer Finances — Finances des 
consommateurs 


Travel — Voyages 
Veterans -— Anciens combattants 


Household Facilities and Equipment —- 
Equipement menager 


Travel - Voyages 


National Child Care - Garde des enfants 


Travel — Voyages 


Apprentices and Journeymen —- 
Apprentis et manoeuvres 


Health and Employment - Sante et 
etat d'emploi 


Telephone Services — Service telephonique 


Month 

Mois 

Jan. - Janv 
Feb. - Fev. 
Feb. -— Fev 
Mar. — Mars 
Mar. — Mars 
Apr. — Avr. 
Apr. - Avr 
May - Mai 
May - Mai 
Jul. = Juill. 
Sept. 

Oct. 

Oct. 

Nov 

Nov. 


Personal & Telephone — Sur place/telephone 


Mailout/Mailback -— Quest. par la poste 


Personal & Telephone - Sur place/telephone 


Personal & Telephone —- Sur place/telephone 


Personal & Telephone - Sur place/telephone 


Mail & Telephone - Poste/telephone 


Personal & Telephone 
Personal & Telephone 


Personal & Telephone 


Personal & Telephone 


Personal & Telephone 


Personal & Telephone 


Personal & Telephone 


Personal & Telephone 


Personal & Telephone 


Sur place/telephone 
Sur place/telephone 


Sur place/telephone 


Sur place/telephone 


Sur place/telephone 


Sur place/telephone 


Sur place/telephone 


Sur place/telephone 


Sur place/telephone 


5 Rot Gps - 5 gr. de renouv 


5 Rot Gps - 5 gr. de renouv. 


5 Rot Gps - 5 gr. de renouv 
5 Rot Gps —- 5 gr. de renouv 
6 Rot Gps —- 6 gr. de renouv 


5 Rot Gps — 5 gr. de renouv. 


1 Rot Gp - 1 gr. de renouv 
4 Rot Gps —- 4 gr. de renouv. 
4 Rot Gos - 4 gr. de renouv. 
3 Rot Gps in 5 Provs 
1 Rot Gp in 4 Provs - 
3 gr. de renouv. dans 5 prov 
1 gr. de renouv. dans 5 prov 
13 Rot Gos - 13 gr. de renouv 
3 Rot Gps in 6 Provs 
1 Rot Gp in 4 Provs - 
3 gr. de renouv. dans 6 prov 


1 gr. de renouv. dans 4 prov 


5 Rot Gps in 1 Prov - 
5 gr. de renouv. 


5 Rot Gps - 5 gr. de renouv. 


6 Rot Gps — 6 gr. de renouv. 


Chapter 11 


Developmental Projects 


11.1. Introduction 


While decennial redesigns offer the principal 
opportunity to implement the major changes in the 
Survey instrument, some improvements can be 
implemented in between redesigns. Traditionally, 
therefore, developmental work has been carried out to 
identify improvements in the survey methodology as a 
continuous feature of the LFS. 


Following the sample redesign during the early 
1960s, several developmental studies were initiated 
that had a large influence on the survey methodology 
introduced during the revision and redesign of the 
1970s. Studies included detailed cost and variance 
component analyses, the effects of proxy-vs. self- 
response, and data collection research that led to 
introduction of telephone interviewing for non-first 
month households in Self Representing areas. 


Studies conducted from 1976 to 1981 included the 
development of sample updating methodology for SR 
areas, sample size stabilization methodology, and 
methods for increasing or decreasing the sample size. 
All these developments were implemented during this 
period. During this period, as well, research and 
evaluation of alternative small area _ estimation 
techniques were continued. The cost and variance 
models were reformulated and used to study 
alternative sample designs, with a view to optimizing 
the number of stages of sampling, and the allocation of 
sample to stages. These studies were influential in 
identifying design changes introduced during the 1981 
post- censal redesign. 


Following the introduction of the 1981 post-censal 
redesign, new developmental studies began. As was 
the case in earlier decades, some of these have 
already led to the implementation of improved survey 
methods. Examples of this are the regression method 
of estimation introduced in 1988, and the introduction 
of some new telephone collection procedures. 


In this chapter, the major developmental projects 
leading up to the 1991 post-censal redesign are 
described. They include small area estimation, 
composite estimation, gross flows, longitudinal data, 
variance studies, telephone and CAT! development, 
and Address Register development. 


Chapitre 11 


Projets de developpement 


11.1. Introduction 


Bien que les remaniements décennaux de |’EPA soient 
l'occasion privilegieée pour la mise en oeuvre des 
changements importants apportées a |’enquéte, il est possible 
d'introduire des améliorations entre ces remaniements. Il y a 
donc toujours des travaux de développement en cours, dont le 
but est de découvrir des facons de perfectionner la 
methodologie de |'EPA. 


A la suite du remaniement du plan de sondage qui a eu 
lieu au debut des années 60, on a entrepris un certain nombre 
d’etudes de developpement qui ont eu une grande influence 
sur la methodologie introduite lors de la revision et du 
remaniement des annees 70. Parmi celles-ci, on comptait des 
analyses detaillees des couts et des composantes de la 
variance, une etude de l’effet des reponses par procuration 
par opposition aux reponses fournies en personne, et des 
travaux de recherche sur la collecte des donnees qui ont 
abouti a l’adoption de l'interview telephonique auprés des 
menages dans les secteurs autorepresentatifs qui ne 
participent pas a |’enquéte pour la premiere fois. 


Les etudes realisees entre 1976 et 1981 ont conduit a 
elaboration d'une methode de mise a jour de |'echantillon 
pour les secteurs AR, d'une méthode de stabilisation de la 
taille de |’echantillon et de methodes d’elargissement et de 
retrecissement de la taille de l’échantillon. Toutes ces 
methodes ont ete mises en application aussitot elaboree. On 
a continue pendant la meme période a chercher et a evaluer 
d'autres techniques d’estimation pour les petites regions et on 
a reformulé les modeles de cout et de variance, qu'on a 
utilises pour etudier d'autres plans de sondage eventuels qui 
permettraient —_d’optimiser le nombre de degres 
d'échantillonnage et la repartition de |’échantillon entre les 
degres. On_s’est base sur le résultat de ces études pour 
décider des changements a apporter au plan de sondage 
apres le recensement de 1981. 


De nouvelles etudes de développement ont ete 
entreprises apres le remaniement du plan de sondage qui a 
suivi le recensement de 1981. Comme par le passe, certaines 
de ces etudes ont déja mene a l’adoption de meilleures 
techniques d’enquéte. On peut citer par exemple la méthode 
d’estimation par regression introduite en 1988 et les nouvelles 
methodes de collecte de données par telephone. 


Nous allons decrire dans ce chapitre les principaux 
projets de developpement en cours en prevision du 
remaniement du plan de sondage qui aura lieu apres le 
recensement de 1991. Ils portent notamment sur |'estimation 
pour les petites regions, l’estimation composite, les flux bruts, 
les données longitudinales, les etudes de la variance, les 
nouvelles facons d/utiliser linterview telephonique et de 
interview telephonique assistee par ordinateur et enfin le 
registre d’adresses. 


11.2 Small Area Estimation 


A major focus of the post-1981 censal redesign of 
the LFS was on improved subprovincial data. Two 
principal measures were taken in this respect. First, as 
described in Chapter 5, major changes were made to 
the sample allocation scheme. Whereas in previous 
designs, the Non_ Self-Representing and _ Self- 
Representing areas were sampled at uniform rates 
within each province, in the redesign, variable sampling 
rates were adopted so as to achieve pre-specified 
levels of reliability for monthly estimates for Census 
Metropolitan Areas and Economic Regions and 
quarterly estimates for Census Agglomeration areas. 


Second, a flexible small area estimation capacity 
was introduced to meet the demand for survey 
estimates for other subprovincial areas, which could 
not be explicitely taken into account when designing 
the survey. We refer to such areas an unplanned 
domains. 


Boundaries of the unplanned domains will typically 
cross the survey design strata. Given the clustered 
nature of the LFS sample, particularly in NSR areas, 
the unplanned domains can range from being severely 
under-sampled to severely over-sampled; this is 
relative to rates at which they would have been 
sampled had they been design strata. 


Following extensive research and evaluation of 
alternative estimation methodologies for these 
unplanned domains, the sample size dependent 
estimator proposed by Drew, Singh and Choudhry 
(1982) was implemented. As the name suggests, this 
particular estimator depends on the outcome of the 
given sample. If the sample size within the domain is 
reasonably large, then the sample size dependent 
estimator is based entirely on the sample falling in the 
domain. If the sample size is not sufficiently large, the 
estimate for the small area is constructed as a linear 
combination of an estimate based on sample falling in 
the domain, and an estimate based on sample from 
those strata which are partly in the domain. In such 
cases, the reliance on sample falling outside the 
domain increases as the amount of the sample falling 
inside the domain decreases. The sample size 
dependent estimator is obtained separately for each of 
the area types identified in the design of the survey 
such as SR, NSR- urban, NSR-rural, and so on. The 
overall estimate from the sample falling outside the 
domain will be less than a certain prespecified 
maximum acceptable value — otherwise the domains 
are combined. 


If independent population estimates for the small 
areas are also available, the LFS estimates are 
benchmarked to these external population estimates. 
There is significant improvement in the reliability of the 
LFS estimates due to population adjustment at the 
small area level. 
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11.2 Estimation pour les petites regions 


Un des objectifs principaux du remaniement de I'EPA qui 
a eu lieu apres le recensement de 1981 était |’amelioration 
des données infraprovinciales. A cette egard, on a pris 
principalement deux mesures. Premierement, comme nous 
l’'avons vu au chapitre 5, le mode de repartition de |’échantillon 
a été grandement modifié. Alors qu’auparavant on avait 
utilisé des fractions de sondage uniformes pour les secteurs 
non autoreprésentatifs et les secteurs autorepresentatifs de 
chaque province, a l'occasion du remaniement, on a adopte 
des fractions de sondage variables afin que les estimations 
mensuelles relatives aux régions metropolitaines de 
recensement et aux regions economiques et les estimations 
trimestrielles relatives aux agglomérations de recensement 
atteignent certains niveaux de fiabilité pre-établis. 


Deuxiemement, on a introduit une méthode d’estimation 
souple pour les petites régions afin de pouvoir répondre a la 
demande d’estimations concernant les autres regions infra- 
provinciales dont il n’avait pas ete tenu compte de facon 
explicite au moment de |’élaboration du plan de sondage. 
Nous appelons ces regions des domaines non prévus. 


Les domaines non prévus on tendance a chevaucher les 
strates définies par le plan de sondage. Etant donne que 
l’6chantillon de |’EPA est réparti en grappes, particuliérement 
dans les secteurs NAR, les domaines non prévus peuvent étre 
sérieusement sous-échantillonnes comme ils peuvent étre 
sérieusement suréchantillonnes par rapport au taux de 
sondage qui aurait été le leur s’il s’agissait de strates définies 
par le plan. 


A la suite de recherches poussées et de |’évaluation des 
autres méthodes d’estimation qu’on aurait pu appliquer a ces 
domaines non prévus, on a adopteé l’estimateur qui dépend de 
la taille de |’échantillon propose par Drew, Singh et Choudhry 
(1982). Comme son nom I'indique, cet estimateur depend de 
la taille effective de l’échantillon. Si celle-ci est raison- 
nablement grande pour le domaine, l’estimateur est fonde 
entierement sur |’échantillon qui se trouve a lintérieur du 
domaine. Si elle n'est pas assez grande, |’estimateur pour la 
petite region est construit de matiere a étre une combinaison 
linéaire d’un estimateur fondeé sur |’échantillon qui tombe dans 
le domaine et d’un estimateur fondé sur un échantillon tiré 
dans les strates qui sont en partie dans le domaine. Dans ces 
cas-la, le recours a |’échantillon a l’extérieur du domaine 
augmente au fur et a mesure que diminue la taille de 
l’échantillon a lintérieur du domaine. L’estimateur lie a la 
taille de |’échantillon est calculé separément pour chacun des 
genres de secteur définis par le plan de sondage de |’enquéte, 
soit les SA, les parties urbaines des SNAR, les parties rurales 
des SNAR, etc. L’estimation globale pour |’echantillon a 
l’extérieur du domaine doit étre inférieure a une valeur 
maximum acceptable établie d’avance, sans quoi les 
domaines sont combines. 


Si on a, en plus, acces a des chiffres de population 
independants relativement aux petites régions, on s’en sert 
comme données de référence pour les estimations de I'EPA. 
La fiabilite des donnees de |l’EPA est augmentée de facon 
significative par les corrections apportées aux chiffres de 
population au niveau des petites regions. 


Finally, in the case of an exhaustive set of 
domains covering an entire province the estimates are 
also raked to achieve consistency by labour force 
status (employed, unemployed, and not in labour force) 
at the province level at the same time as assuring 
consistency for the total population at the small area 
level. If the external population estimates for the small 
area were not available, then the LFS estimates are 
simply ratio adjusted to achieve consisiency by labour 
force status at the province level. 


Unplanned domains include Census Divisions. for 
which three-year moving average estimates are 
produced each year, and Canada Employment Centres 
and Federal Electoral Districts, for which annual 
estimates have been produced. 


In the post-redesign period, research has 
continued into improved small area estimation. 
Choudhry and Hidirogiou (1988), and Choudhry and 
Rao (1989) have investigated time series regression 
approaches which in addition to using the survey data, 
make use of external data such as counts of 
Unemployment Insurance beneficiaries. The more 
sophisticated methods currently under investigation 
have potential for improving estimation for planned as 
well as unplanned domains. 


11.3. Composite Estimation 


For continuous surveys, generally both estimates 
of level and estimates of change are important. The 
requirement for these two types of estimates can be 
taken into account both in the sample design and in 
the estimation methods used for the survey. 


In the Labour Force Survey, the sample design 
reflects the need for both types of estimate. For 
example, the sample was allocated to provide reliable 
monthly estimates of level for the provinces and for 
subprovincial regions. Similarly, the rotating panel 
design of the LFS, in which five-sixths of the sample is 
common from one month to the next, results in efficient 
estimates of change. This is because most 
characteristics of individuals and households are 
positiviely correlated over time. Current LFS estimation 
procedures, on the other hand, do not explicitly take 
into account the requirement for the two types of 
estimates. Estimates of level are constructed 
independently for each survey occasion, following the 
procedures outlined in Chapter 8, and estimates of 
change are derived simply as the differences between 
respective estimates of level. Specifically, there 1s no 
exploitation of the overlapping nature of the sample 
design in order to improve estimates of change, or, for 
that matter, estimates of level. 
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Enfin, dans le cas d'un ensemble exhaustif de domaines 
recouvrant une province entiere, les estimations sont 
également souniises a une méthode de balayage qui vise a 
les rendre conformes aux estimations selon la situation vis-a- 
vis de l'activite (personnes occupées, en chdmage et 
inactives) au niveau provincial et a faire en sorte que les 
données relatives a la population totale concordent avec celles 
sur les petites regions. Si on n'a pas de chiffres de population 
pour les petites regions en provenance d'une autre source, on 
redresse simplement les estimations de |’'EPA par la méthode 
du quotient de maniére qu’elles soient conformes aux 
estimations selon la situation vis-a-vis de |’activité au niveau 
provincial. 


Les domaines non prévus comprennent les divisions de 
recensement, pour lesquelles on produit chaque année des 
estimations de moyennes mobiles de trois ans, ainsi que les 
Centre d'emploi du Canada et les circonscriptions électorales 
federales, pour lesquelles on produit des estimations 
annuelles. 


Les travaux de recherche se sont poursuivis apres le 
remaniement du plan de sondage en vue de |’amelioration de 
estimation pour les petites regions. Choudhry et Hidiroglou 
(1988) et Choudhry et Rao (1989) se sont penches sur les 
methodes de regression appliquees a des_ series 
chronologiques, qui utilisent non seulement les donnees 
d’enquete mais aussi d’autres données comme le nombre de 
beneficiaires de  l’assurance-chomage. Les methodes 
sophistiquées qui sont actuellement a l'étude pourraient 
éventuellement ameéliorer l’estimation tant pour les domaines 
prevus que pour les domaines non prevus. 


11.3. Estimation composite 


Avec les enquétes permanentes, il est generalement 
important de produire a la fois des estimations de niveau et 
des estimations de la variation. Il est possible de tenir compte 
des exigences relatives a ces deux sortes d’estimations soit 
dans le plan de sondage soit dans les methodes d’estimation 
choisies pour l’'enquete. 


Pour ce qui est de |’enquéte sur la population active, c’est 
dans le plan de sondage que les deux sortes d’estimation sont 
prevues. Ainsi, l’echantillon est reparti de maniere a ce qu’on 
puisse produire des estimations mensuelles des niveaux qui 
soient fiables pour les provinces et pour les regions 
infraprovinciales. Le mode de renouvellement de |’echantillon, 
selon lequel les cinq sixiemes de |'échantillon ne changent 
pas d'un mois a l'autre, permet aussi d’obtenir des 
estimations efficaces de la _ variation, puisque les 
caracteristiques des particuliers et des méenages sont en 
correlation directe dans le temps. En revanche, les méethodes 
d'estimation de |'EPA qui sont utilisees en ce moment ne 
tiennent pas compte explicitement des exigences relatives aux 
deux sortes d’estimations. Les estimations de niveau sont 
calculees indeépendamment a chaque passage de |'enquéte, 
de la maniére décrite au chapitre 8, et les estimations de la 
variation sont simplement obtenues en faisant la difference 
entre les estimations de niveau correspondantes. Autrement 
dit, on n'exploite pas le fait qu'il y a un chevauchement de 
'échantillon en vertu du plan de sondage pour améliorer les 
estimations de la variation ni, de fait, les estimations des 
niveaux. 


During the research phase of the post-1981 censal 
redesign, composite estimation methods were 
investigated as a means of taking the rotating panel 
nature of the design into account in the estimation 
procedure. For month m, the composite estimate y’,, 
is defined by: 


Pisoni K penis seid epg) OR kee 


where y,, is the current estimate, and d,,;, is the 
estimate of change based on the common part of the 
sample in months m and m-1, and K is an arbitrary 
constant whose value is typically chosen based on 
efficiency considerations. 


Hence the composite estimate of level for month m 
is a weighted average of (i) the usual cross-sectional 
estimate for month m, and (ii) the composite estimate 
for month m-1 plus the estimate of change from month 
m-1 tom based on the common sample. 


The study of composite estimation was undertaken 
by Kumar and Lee (1983). Their key findings, and 
conclusions on areas requiring further investigation, are 
described below. 


Examination of the composite estimate defined in 
(1) indicated that the optimal value of K varies 
depending on the characteristic and on the type of 
estimate (change or level). The use of the optimal 
values of K for the different estimates would result 
therefore in consistency problems. For example, the 
optimal estimate of persons in the labour force would 
not equal the sum of the optimal estimates of persons 
employed and of persons unemployed. A common 
value of K = 0.4 was found, though, to be a reasonable 
compromise. 


The study of composite estimation was extended 
to consider a broader class of estimators, refered to in 
the literature as ‘AK’ composite estimators. These 
were investigated primarily to handle complications 
arising from the fact that estimates based on the panel 
or rotation group in the sample for the first time differ 
in expected value from estimates based on the 
remaining panels. This phenomenon, known as rotation 
group bias, was reported by Bailar (1975). The AK- 
composite estimate is defined as follows: 


Ym, j 


6 
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where y,,, IS the estimate for the j-th panel for month 
m, and where A is another constant. 
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Pendant la période de recherche qui a precédeé le 
remaniement du plan de sondage du debut des années 80, on 
a étudié des methodes d’estimation composite pour voir s'il 
serait possible de tenir compte, dans la méthode d’estimation, 
du fait que le plan de sondage est un plan avec 
renouvellement de |’échantillon. Pour le mois m, l’estimation 
composite y’,, est defini par l’equation : 


ue a (1 re Lin a 5G ot Gn2imndsO < k< 1, (1) 


ou y,, est l’estimation courante, d,.,; est l'estimation de la 
variante fondée sur la partie de l’échantillon commune aux 
mois m et m-1 et K est une constante arbitraire dont la valeur 
est genéralement choisie selon des criteres d’efficacite. 


L’estimation composite du niveau pour le mois m est donc 
une moyenne pondérée (i) de |’estimation transversale nor- 
male pour le mois m et (il) de l’estimation composite pour le 
mois m-1 plus l’estimation de la variation du mois m par 
rapport au mois m-1 selon la partie de |’echantillon commune 
au deux. 


L’étude de l’estimation composite a été entreprise par 
Kumar et Lee (1983). Les principaux résultats et les con- 
clusions concernant les domaines nécessitant des recherches 
plus poussées sont décrits ci-apres. 


ll est ressorti de l’examen de lestimation composite 
définie par l’equation (1) que la valeur optimale de K varie 
selon la caractéristique et la sorte d’estimation (variation ou 
niveau). Si on utilisait les valeurs optimales pour les diffé- 
rentes estimations, on aurait des problemes de coherence. 
L’estimation optimale du nombre de personnes dans la popu- 
lation active, par exemple, ne serait pas egale a la somme de 
l’estimation optimale du nombre de personnes occupées et du 
nombre de personnes en chomage. On a toutefois trouve 
qu’une valeur de K = 0.4 pour toutes les estimations etait un 
compromis acceptable. 


On a élargi le champ de |’étude pour examiner une caté- 
gorie plus grande d’estimateurs, connus dans les ouvrages 
spécialisés sous le nom d’estimateurs composites ‘AK’. Le but 
principal etait de resoudre les complications qui surviennent 
du fait que la valeur prevue des estimations fondées sur le 
groupe de renouvellement inclus dans l’echantillon pour la 
premiere fois est differente de celle des estimations fondées 
sur les autres groupes. Ce phénomene, qu’on appelle le biais 
de renouvellement, a été observe par Bailar (1975). 
L’'estimation composite AK est definie par |’equation : 


Ym, j 
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OU y,,; est l’estimation pour le j-ieme groupe pour le mois m 
et ou A est une autre constante. 


This composite estimate was initiall ro 
Gurney and Daly (1955). Note that pit enn ws 
when A=0. As it defines a bigger class, the AK- 
composite estimate can improve the variance 
efficiency over the K-composite estimate defined by 


(1). 


. lf it is assumed that the normal cross-sectional 
estimate y,, is unbiased, and if mean square error is 
the criterion for efficiency, then the K-composite esti- 
mate performs poorly, since in effect it results in 
unequal weighting of the rotation groups. However, by 
choosing appropriate values for A and K, the bias with 
respect to y,, can be controlled. Study findings were 
that the AK-composite estimate is superior to the ratio 
and K-composite estimates with respect to a mean 
square error criterion. 


The initial studies on composite estimation were 
positive, but they pointed to areas requiring further 
research and evaluation. Hence the decision was 
taken not to implement composite estimation co- 
incident with the 1981 post-censal redesign of the 
sample, and to defer its futher study until the post- 
redesign period. Some aspects where further 
investigation is planned preparatory to the next 
redesign include the following: the impact of changing 
the estimation method for the cross-sectional estimate 
from the raking ratio to the regression method on the 
choice of the parameters A and K; the siability of 
efficiency gains for choices of A and K over longer 
periods of time; the effect of composite estimates on 
seasonally adjusted series; and implementation 
options, including, for operational convenience, the 
actual derivation of composite estimates only for 
provincial estimates of unemployed, employed and not 
in the labour force, and using these as control totals in 
the regression estimate. 


11.4 Gross Flows 


For panel survey data, it is of common interest to 
estimate gross flows (i.e., frequencies of individuals 
making transitions between categories or continuing In 
the same category from one time point to another) for 
a characteristic that is categorical in nature. For 
example, in the LFS, the characteristic of interest might 
be the labour force status for each individual, which is 
reported as either E (Employed), U (Unemployed), or N 
(Not in the labour force). The (E, U, N) table of 
estimated gross flows for time points ¢1 and t Is 
important for better understanding labour market 
dynamics and their impact on individual members of 
the population, than is possible from the analysis of the 
net flowsfrom the cross-sectional data. Of special 
interest are the off-diagonal cells indicating monthly 
flows from one labour force status to another. 


A major problem in estimating gross flows other 
than the usual problem of non-response arises due to 
the presence of response Or classification errors. It is 
commonly believed that biases in the stock levels (that 
is, the marginal frequencies in the gross flow table) — 
negligible, but the gross flows or interior peepelta t O 
the table may be considerably biased. In particular, 
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Gurney et Daly (1955) ont été les premiers a proposer 
cette estimation composite. Remarquons que y",, devient y‘, 
lorsque A=0. Comme |'estimation composite AK représente 
une plus grande catégorie, elle constitue une amelioration par 
rapport a l’estimation composite K definie par |’equation (1) du 
point de vue de l’efficacité de la variance. 


Si l'on suppose que |'estimation transversale normale y,, 
n'est pas biaisée et si l'erreur quadratique moyenne est le 
critere d’efficacité, l’estimateur composite K est peu efficace, 
car il en déecoule une pondeération inegale pour les groupes de 
renouvellement. Toutefois, on peut réduire le biais de y,, en 
attribuant a A et a K des valeurs approprieées. Selon les 


resultats de l'étude, si l’on prend pour critére |'erreur 
quadratique moyenne, |l'estimation composite AK _ est 
supérieure a l'estimation par quotient et a |’estimation 


composite K. 


Les premieres études realisees a propos de |’estimation 
composite etaient positives, mais elles ont mis en evidence 
des domaines sur lesquels il fallait pousser les recherches et 
les evaluations. Il a done eté decide de ne pas adopter 
l’estimation composite au moment du remaniement du plan de 
sondage du debut des annees 80 et de remettre a apres la 
periode de remaniement la poursuite des travaux d’etude d’y 
rapportant. Parmi les questions qui vont faire l’objet d'autres 
recherches en prevision du prochain remaniement du plan de 
sondage, mentionnons les consequences qu’aura sur le choix 
des parametres A et K le fait de passer de la méthode du 
quotient a la methode de regression pour les estimations 
transversales; la stabilite a plus long terme des gains 
d'efficaciteé pour des valeurs choisies de A et de K; |'effet des 
estimations composites sur les series désaisonnalisées; la 
mise en oeuvre d'options dont, pour des raisons d’ordre 
pratique, le calcul d’estimations composites seulement pour 
les estimations provinciales du nombre de personnes en 
chomages, occupeées et inactives et l'utilisation de ces 
estimations comme totaux de controle dans |'estimation par 
regression. 


11.4 Flux bruts 


Lorsqu’on dispose de données tirées d’enquétes par 
panel, il est toujours interessant d’estimer les flux bruts (c’est- 
a-dire la frequence a laquelle les personnes passent d'une 
catégorie a l'autre ou restent dans la meme categorie entre 
deux moments données) pour une caracteristique qualitative. 
Dans |'EPA, par exemple, la caracteristique a |’etude pourrait 
étre la situation de chaque personne vis-a-vis de |’activite, 
déclaree comme etant O (occupé), C (en chomage) ou | 
(inactif). Le tableau (O, C, 1) des flux bruts estimés pour les 
moments ¢ et ¢-1 est important si l'on veut mieux comprendre 
la dynamique du marche du travail et ses effets sur les 
membres de la population qu'on ne peut le faire en analysant 
les flux nets dérives des données transversales. Les cases qui 
ne sont pas sur la diagonales et qui indiquent les flux 
mensuels d'une situation vis-a-vis de |’activite a une autre sont 
particulierement intéressantes. 


Un gros probleme, autre que celui de la non-reponse, 
auquel on se heurte lorsqu'on estime les flux bruts est du a la 
présence d’erreurs de réponse ou de classement. Beaucoup 
croient que les biais dont sont entachees les estimations de 
stocks (c’est-a-dire la frequence marginale dans le tableau de 
flux bruts) sont néegligeables, mais il se peut que les flux bruts 
ou fréquences intérieures soient considerablement biaises. II 


there may be serious upward biases in the off-diagonal 
cell flows. This follows since even small classification 
errors for the large diagonal cells (which correspond to 
no change in status) translate into large relative errors 
for the much smaller off-diagonal cells (which 
correspond to changes in status). The factors that 
could contribute to classification errors include proxy 
response, a misunderstanding of questions asked in 
the interview, coding errors, and interviewer errors. 


A popular method for correcting classification 
errors is based on the availability of reinterview data for 
estimating error rates under the assumption of 
independent classification errors; see, for example, 
papers by Abowd and Zellner (1985), and Chua and 
Fuller (1987). By independent classification errors we 
mean that the probability of the observed classification 
being in error at time ¢ depends only on the true 
classification at time ¢, and not on the true or observed 
classification at time t-1. On the other hand, if the 
response errors were serially dependent, say, 
positively correlated, this would tend to decrease the 
number of reported changes and increase the number 
of reported continuations of the previous category. 
Hence the adjustment required to correct for 
classification errors would be smaller under positively 
correlated classification errors than under independent 
classification errors. 


Some important efforts were made at Statistics 
Canada on addressing the problem of assessing 
classification bias in gross flows. An empirical 
evaluation of the methods based on the independent 
classification errors assumption was made by Lemaitre 
(1988) which showed that these methods might be 
overcorrecting for response bias. Gentleman (1988) 
discussed implications of some commonly made 
assumptions such as unbiased stock estimates and 
independent classification errors, and concluded that 
these assumptions led to results that were not 
supported by the empirical data used in her study. 
Singh and Lemaitre (1989) attempted to avoid the 
assumption of independent classification errors by 
using an e-contamination model for response error. An 
alternative source, namely administrative data on 
unemployment insurance (UI) beneficiaries, was used 
instead of reinterview data for estimating the model 
parameter e analogous to response error probabilities. It 
should be noted that the independent errors 
assumption would not have been needed if it were 
possible to carry out double re-interviews, (that is, re- 
interviewing the same respondents in two consecutive 
months), but this approach was not pursued due to 
operational and response burden considerations. 


In the e-contamination model, the response errors 
are specified by means of a contamination distribution 
assumed for individuals prone to response error. This 
distribution is estimated under the assumptions that 
stock estimates are unbiased and that responses for 
the two time points are independent only for those 
individuals who are prone to error. The mixing 
parameter e (roughly the fraction of individuals in the 
population who are prone to response error) provides a 
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se peut en particulier qu'il y ait d’importants biais par exces 
dans les flux des cases qui ne, sont pas sur la diagonale, car 
méme de petites erreurs de classement pour les cases 
diagonales dont l’effectif est eleve (qui correspondent a aucun 
changement de situation) se traduisent par de grosses erreurs 
relatives pour les cases qui ne sont pas sur la diagonale et 
dont |’effectif est beaucoup moins eleve (qui correspondent a 
un changement de situation). Les facteurs susceptibles de 
causer des erreurs de classement sont les réponses par 
procuration, le fait de ne pas comprendre ou de mal 
comprendre les questions posees pendant l'interview, les 
erreurs de codage et les erreurs d'interview. 


ll existe une méthode tres utilisée pour la correction des 
erreurs de classement qui consiste a estimer les taux d’erreur 
a l'aide des données provenant des reinterviews et repose sur 
'hypothese selon laquelle les erreurs de classement sont 
indépendantes; voir par exemple l'article de Abowd et Zellner 
(1985) et celui de Chua et Fuller (1987). Par erreurs de 
classement indépendantes, on veut dire que la probabilite que 
le classement observe soit errone au moment ¢ depend 
seulement du classement réel au moment ¢ et non du 
classement réel ou observé au moment t-1. Si, en revanche, 
les erreurs de réponse étaient liées (si elles était en 
correlation directe par exemple), le nombre de changements 
déclarés serait inferieur et le nombre de reponses identiques 
aux reponses données antérieurement serait supérieur. La 
modification nécessaire pour corriger l’erreur de classement 
serait moins grande dans le cas des erreurs de classement en 
corrélation directe que dans le cas des erreurs de classement 
indépendantes. 


De gros efforts ont ete faits a Statistique Canada pour 
réegler le probleme que pose l’évaluation du biais du aux 
erreurs de classement dans les flux bruts. Lemaitre (1988) a 
effectué une évaluation empirique des méthodes basées sur 
l'hypothese de l’indépendance des erreurs de classement et iI 
a montre que ces méthodes peuvent aboutir a une 
surcorrection du biais de réponse. Gentleman (1988) a 
examine les consequences de certaines hypotheses courantes 
comme l’absence de biais dans les estimations de stocks et 
independance des erreurs de classement, et elle en a conclu 
que ces hypotheses donnent lieu a des résultats qui ne sont 
pas confirmeés par les données empiriques utilisees dans son 
étude. Singh et Lemaitre (1989) ont essaye d’eéviter 
’'hypothese de l’indépendance des erreurs de classement en 
utilisant un modele de contamination avec parametre e pour 
erreur de réponse. Ils ont pris des données provenant d’une 
autre source, en l’occurrence les données administratives sur 
les beénéficiaires de l’assurance-chomage, au lieu des 
données issues des réinterviews, pour estimer le parametre e 
du modeéle, qui est analogue aux probabilites d’erreur de 
reponse. Il convient de noter qu’on n’aurait pas besoin de 
l'hypothese de l’indépendance des erreurs s'il etait possible 
de faire des réinterview doubles, c’est-a-dire de réinterviewer 
les memes repondants deux mois de suite, mais on ne |’a pas 
fait pour des raisons d’ordre opeérationnel et pour ne pas 
alourdir le fardeau de réponse. 


Dans le modele de contamination avec parametre e, on a 
specifie les erreurs de reponse au moyen d'une distribution 
de contamination qu'on estime étre celle des personnes 
portees a commettre des erreurs de reponse. On estime cette 
distribution en faisant lhypothese que les estimations de 
stocks ne sont pas biaisees et que les réponses aux deux 
moments donnes sont indeépendantes uniquement en ce qui 
concerne les personnes portees a faire des erreurs. Le 
parametre e (approximativement le pourcentage de personnes 


link with the true underlying gross fl istributi 
Methods for refining the bethrass ti roe 
performing a simulation study for evaluation purposes 
are currently under investigation; see also Singh and 
Rao (1990) for further developments. 


11.5 Longitudinal Data 


The longitudinal data resulting from LFS 
households remaining in the Survey sample for six 
consecutive months can provide additional information 
not available in data from a single month. However, 
most of the estimates and analyses currently use only 
cross-sectional data. The discovery of a number of 
possible uses for longitudinal data have led to recent 
initiatives to begin exploring the largely untapped 
potential of the longitudinal information. 


For example, analysis of response patterns to 
questions over time can provide new insight into the 
response mechanism and help to identify problematic 
questions. This includes potential ambiguities or 
confusion in concepts or response categories which 
can be identified by examining responses over time 
which are highly improbable or logically inconsistent. In 
this way, the effect of cognitive demands on the 
respondent to answer difficult or subjective questions, 
and of demands on the interviewer to interpret and 
code responses as stated can be assessed. Proxy 
effects can similarly be studied by examining the longi- 
tudinal consistency for proxy versus non-proxy Cases. 


Longitudinal data can also be used to analyze 
labour force trends and patterns at the micro-level. 
Such analyses can yield different results from their 
aggregate counterparts. The measurement and 
analysis of gross flows can be extended to longer 
periods of time, which might, for example, shed light 
on the degree to which observed flows are 
concentrated in a small proportion of the population. 
Borderline job attachment or attachment to the labour 
force can be better assessed with data over time. This 
might also indicate important criteria or specific 
questions affecting changes in labour force status. 


Longitudinal data could also be used for editing. 
This could include the use of on-line edits In a 
dependent interviewing environment, which might help 
reduce longitudinal response inconsistencies. 


Work is currently focused on the analysis of 
response patterns over time, and the development of 
measures of inconsistency for individual questions. 
Results from this study could serve as valuable input in 
the planning of any future redesign of the LFS 
questionnaire and also in improving interviewer 
instructions. The impact of such inconsistencies on 
measurements such as estimates for labour force 
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dans la population qui sont portées a faire des erreurs) sert de 
lien avec la vraie distribution des flux bruts. Des méthodes 
visant a raffiner l’estimation de e et a permettre la réalisation 
d'une etude de simulation a des fins d'évaluation sont 
actuellement a l'étude; voir aussi Singh et Rao (1990). 


11.5 Données longitudinales 


Les données longitudinales obtenues du fait que les 
ménages qui participent a |'EPA font partie de |’échantillon 
pendant six mois consécutifs peuvent fournir des 
renseignements de plus que les données produites apres un 
seul mois. Pourtant, la plupart des estimations et des 
analyses qui sont faites actuellement sont basées uniquement 
sur les données transversales. Comme il y a plusieurs 
utilisations possibles pour les données longitudinales, on a 
commence ces derniers temps a étudier le potentiel non 
exploite de ces données. 


Par exemple, en analysant l’évolution des reponses dans 
le temps, on peut acquérir de nouvelles connaissances sur la 
facon dont les gens repondent et découvrir les questions qui 
posent des problemes. En examinant les reponses qui ne sont 
vraiment pas plausibles ou qui sont en contradiction avec 
d'autres reponses, on peut mettre en evidence des ambiguites 
eventuelles ou une confusion au niveau des concepts ou des 
catégories de réponses. On peut alors évaluer l’effet des 
attentes qu’on a du point de vue cognitif a l’egard des 
repondants a qui on pose des questions difficiles ou 
subjectives et a l’egard de |'intervieweur a qui on demande 
d'interpréter et de coder les reponses. On peut aussi étudier 
l'effet des réeponses par procuration en comparant la 
coherence dans le temps de ce genre de réponses par 
rapport aux reponses données directement par la personne 
interessée. 


ll est egalement possible de se servir des donnees 
longitudinales pour analyser les tendances de la population 
active au niveau des microdonnees. Ces analyses peuvent 
donner des résultats differents de celles realisees avec les 
données agregees. Il est possible de faire porter la mesure et 
l'analyse des flux bruts sur des periodes plus longues, ce qui 
pourrait permettre, par exemple, de determiner dans quelle 
mesure il y a une concentration des flux observes dans une 
petite proportion de la population. Les donnees longitudinales 
peuvent permettre de mieux evaluer l’attachement a |’emploi 
ou la participation au marche du travail a caractere marginal, 
ce qui indiquerait alors quels criteres influent sur les 
changements de situation vis-a-vis de |’activite et quelles 
questions poser. 


Les données longitudinales pourraient aussi servir a la 
vérification. On pourrait notamment faire des verifications en 
direct au cours des interviews avec retro-information, ce qui 
réeduirait peut-étre le nombre de donnees en contradiction 
avec celles recueillies auparavant. 


Les travaux en cours actuellement font principalement 
l'analyse de |’evolution des reponses dans le temps et tentent 
de mettre au point des moyens de mesurer |'incoherence de 
certaines questions en particulier. Les résultats pourraient 
s'averer utile lorsqu’on planifiera la refonte du questionnaire 
de |'EPA et qu’on essaiera d’ameliorer les instructions a 
l'intention des intervieweurs. L’effet de telles incoherences sur 
les mesures comme les estimations relatives aux categories 


status categories and associated gross flows will also 
be assessed. Plans are in place to investigate the 
feasibility of on-line longitudinal edits in a CATI 
environment as part of the research leading up to the 
next redesign. Imputation methods that incorporate 
both cross-sectional and longitudinal data are also 
under investigation. 


11.6 Variance Studies 


The sample variance and the coefficient of 
variation are measures of the sampling error 
associated with survey estimates. Variance estimation 
procedures for the Labour Force Survey are discussed 
in sections 5.10 and 9.2. Research is being carried out 
on alternative variance estimation procedures, 
particularly for application to quantiles, and _ to 
seasonally adjusted data. 


Currently, the LFS uses the jackknife method to 
estimate variances. Although the jackknife is a flexible 
method, research into its properties has shown that it 
may not produce appropriate variance estimates for 
medians and other quantiles. The balanced repeated 
replication (BRR) method of variance estimation, how- 
ever, does not have this drawback. Unlike the 
jackknife, which is based on the omission of one 
cluster or PSU at a time (see section 8.10), BRR is 
based on the omission of a complete half-sample at a 
time. Half-samples are determined by dividing the 
sample in each stratum into two halves, only one of 
which is kept for each replication. By choosing many 
half-samples in a certain pattern, the resulting 
population estimates can be used to derive a valid 
variance estimate. A study to compare these variance 
estimation procedures is in progress. 


The LFS is used to obtain both unadjusted and 
seasonally adjusted estimates of characteristics, such 
as persons unemployed and in the labour force. 
Currently, variances are available only for the 
unadjusted estimates. The derivation of appropriate 
variances for seasonally adjusted estimates is 
particularly important since the adjusted estimates are 
used for analysis and planning and are announced 
regularly by the news media. Research into variance 
estimation for seasonally adjusted data is in progress. 


11.7. Telephone and CATI Development 


Telephone interviewing was first introduced to the 
Labour Force Survey during the early 1970s. A "warm" 
telephone interviewing procedure was in_ place, 
whereby the initial month’s interview was face-to-face, 
but follow-up interviews in later months, provided the 
respondent gave his or her consent, were conducted 
by telephone from the interviewer's home. The 
telephone procedure was restricted to Self 
Representing areas. Following successful testing 
during the post-1981 censal redesign, the warm 
telephoning procedure was extended to remaining 
areas. 
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d’activité et aux flux bruts s'y rapportant sera aussi évalue. En 
prévision du prochain remaniement du plan de sondage, i! est 
question qu’on eétudie la _ faisabilite de verifications 
longitudinales en direct dans le contexte de |'interview tele- 
phonique assistée par ordinateur. On examine aussi en ce 
moment des méthodes d’imputation incorporant a la fois les 
données transversales et les données longitudinales. 


11.6 Etudes de la variance 


La variance de |’echantillon et le coefficient de variation 
sont les mesures de l’erreur d’echantillonnage dont sont 
entachées les estimations produites a partir des résultats des 
enquétes. Les facons dont on estime la variance pour 
l’enquéte sur la population active sont traitees aux sections 
5.10 et 9.2. Des travaux de recherche en cours examinent 
d'autres methodes d’estimation de la variance, en particulier 
pour ce qui a trait aux quantiles et aux donnees 
désaisonnalisées. 


Actuellement, pour |'EPA, on se sert de la méthode du 
jackknife pour estimer les variances. Bien que cette methode 
soit souple, des travaux de recherche sur ses proprietes ont 
montré qu’elle ne produit peut-étre pas de bonnes estimations 
en ce qui a trait aux medianes et aux autres quantiles. La 
repetition compensée est une méthode d’estimation de la 
variance qui n’a pas cet inconvenient. Contrairement a la 
méthode du jackknife, selon laquelle il faut omettre une 
grappe ou une UPE a la fois (voir la section 8.10), la repetition 
compensée repose sur |’omission d’une moitié entiere de 
’échantillon a la fois. On obtient la moitié de |’échantillon en 
divisant en deux |’échantillon dans chaque strate et en n’en 
gardant qu’une moitié pour chaque repetition. En suivant une 
certain ordre pour choisir un grand nombre de demi- 
échantillons, on obtient des estimations de la population dont 
on peut se servir pour calculer une estimation de la variance 
qui est valable. Ces deux méthodes d’estimation de la va- 
riance font actuellement |’objet d’une comparaison. 


On se sert des résultats de EPA pour produire a la fois 
des estimations brutes et des estimations deésaisonnalisees 
relativement a des caractéristiques comme le nombre de 
personnes en chomage et l’effectif de la population active. A 
l'heure actuelle, on ne calcule la variance qu’en ce qui 
concerne les estimations brutes. Or, il est particulierement 
important que les variances relatives aux estimations 
desaisonnalisées soient connues, car ce sont ces estimations 
qu'on utilise pour les analyses et la planification et que les 
médias diffusent regulierement. Des recherches sont en cours 
a ce sujet. 


11.7 Nouvelles fagons d’utiliser l’interview 
teléphonique et l’interview télephonique 
assistée par ordinateur 


L’interview télephonique a été introduite dans l’enquéte 
sur la population active au début des années 70. On a choisi 
une approche selon laquelle on ne procédait pas a froid; c’est- 
a-dire que, le premier mois, on faisait une interview en 
personne, pour poursuivre les mois suivants, si le repondant 
etait d’accord, par des interviews télephoniques que 
"intervieweur menait de chez lui. On a limite les interviews 
telephoniques aux secteurs autoreprésentatifs. Les essais 
menes pendant le remaniement du plan de sondage au début 
des annees 80 ayant donne de bons résultats, cette méthode 
a ete etendue aux autres secteurs. 


alata 1986, a program of research and testing was 
initiated to investigate new telephone survey methods 
with a view to reducing survey costs and improving 
data quality. Telephone studies conducted from 1986- 
1989 have included: (i) extending telephone inter- 
viewing to first-month-in-sample cases, by local 
interviewers under the area sample design; (ii) 
conducting the LFS as a central telephone survey with 
both telephone sampling and telephone collection, (iii) 
using Computer Assisted Telephone Interviewing 
(CATI) methods, (iv) using a mixed organization 
whereby interviewing is done by a combination of local 
interviewers doing face to face interviewing, and 
central interviewers telephoning from the regional 
officer, and (v) studying frame issues. 


Findings from these studies are reported by Drew, 
Dick and Switzer (1989), and are highlighted below. 
These are followed by comments on the frame and 
data collection methods likely to be implemented in the 
post-1991 censal redesign. 


Two procedures for telephoning under the area 
frame were implemented after testing. The first 
consists of telephone follow-up of first month cases 
where no contact was made during an initial visit. 
Interviewers obtain telephone numbers using reverse 
directories, names on mail boxes, and so forth. This 
procedure has led to telephoning for 20 percent of first 
month cases. The second procedure consists of a 
head office computerized match of addresses for 
selected dwellings against lists containing published 
telephone numbers purchased from telephone 
companies. Where telephone numbers are obtained, 
the local interviewer conducts first month interviews by 
telephone, with face to face follow-up of nonresponse. 
This procedure is scheduled for implementation during 
1990 for the apartment frame sample, where it has 
been shown the procedure leads to 50%-60% of first 
month cases being interviewed by telephone, with 
lower nonresponse rates. The procedure is still under 
evaluation for the remainder of urban areas. 


Two tests of the LFS as a centralized telephone 
survey conducted by interviewers working out of the 
regional offices were carried out. The tests examined 
both Random Digit Dialing (RODD) and telephone list 
sampling methods. Principal findings were that while 
the costs of the centralized telephone methodology 
were considerably less than those of the traditional 
methodology, nonresponse rates were higher - 9% to 
12% for the test compared to 4.5% for the ongoing 
LFS. No significant differences were found between 
survey estimates for the test treatments, and those for 
the ongoing LFS adjusted to exclude households 
without telephones. 


A test of Computer Assisted Telephone 
Interviewing compared the conduct of the LFS as a 
central telephone survey using CAT! methods versus 
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En 1986, on a lancé un programme de recherche et 
d’essais visant a étudier de nouvelles méthodes d'interview 
teléphonique qui permettraient de réduire le cout de |l’enquéte 
et d’ameliorer ia qualité des données. De 1986 a 1989, ony a 
examine plusieurs possibilités, dont les suivantes : (i) étendre 
l'interview telephonique aux ménages du premier groupe de 
renouvellement et faire faire celle-ci par des intervieweurs 
locaux dans les secteurs ou |'échantillon est aréolaire: (ii) 
mener |'EPA en tant qu’enquéte telephonique centralisée ou 
l‘echantillonnage et la collecte des données se feraient par 
telephone; (iii) utiliser les méthodes d’interview télephonique 
assistee par ordinateur; (iv) utiliser une approche mixte, selon 
laquelle certaines interviews seraient faites sur place par des 
intervieweurs locaux et certaines seraient faites par télephone 
a partir du bureau regional; (v) régler les problemes lies a la 
base de sondage. 


Drew, Dick et Switzer (1989) ont fait état des résultats de 
ces études. Nous allons les resumer ci-aprés et y ajouter des 
remarques au sujet des methodes d’etablissement de la base 
de sondage et de collecte des donnees qui _ seront 
probablement adoptees au moment du remaniement du plan 
de sondage qui suivra le recensement de 1991. 


Deux methodes d’interview telephonique aupres des 
menages de la base aréolaire ont ete adoptees a la suite des 
essais. La premiere consiste a faire un suivi telephonique 
aupres des ménages du premier groupe de renouvellement 
s'il n'y a pas eu de contact a la premiere visite. Les 
intervieweurs obtiennent les numeéros de telephone en 
consultant, entre autres, les annuaires ou les abonneées sont 
inscrits par ordre de numero et les noms sur les boites aux 
lettres. Cette méthode a permis de joindre par telephone 20% 
des menages du premier groupe de renouvellement. La 
seconde consiste a apparier, dans un ordinateur du bureau 
central, les adresses de certains logements et des listes de 
numeros de telephones achetees aupres des compagnies de 
telephone. Lorsqu’on trouve le numero qui correspond a une 
adresse, l'intervieweur local effectue une interview 
telephonique des le premier mois, et fait un suivi sur place s'il 
nobtient pas de reponse. Cette méthode doit étre mise en 
application dans le courant de 1990 aupres des menages de 
la base d’appartements, ou il a ete etabli qu'elle permettrait 
d’interviewer par telephone 50 a 60% des menages du 
premier groupe de renouvellement et qu’elle entrainerait une 
baisse des taux de non-reponses. L'evaluation de cette 
methode pour le reste des regions urbaines n’est pas 
terminee. 


On a realise deux essais portant sur la possibilite de faire 
de |'EPA une enquéte telephonique centralisée dans le cadre 
de laquelle les intervieweurs meneraient les interviews du 
bureau regional. Deux meéethodes ont ete examinees: la 
composition aleatoire et |’echantillonnage a partir de listes de 
numéros de telephone. Les essais ont montre que la methode 
d'interview telephonique centralisee revient beaucoup moins 
cher que les methodes traditionnelles, mais qu’en revanche 
elle augmente le taux de non-reponse (9 a 12% pendant 
l'essai, Comparativement au taux habituel de 4.5% pour 
EPA). On n’a pas releve de differences significatives entre 
les estimations produites a partir des données recueillies dans 
le cadre des essais et les estimations normales de I'EPA 
desquelles avaient ete exclues les données relatives aux 
menages sans telephone. 


Dans un autre essai, On a compare la tenue de |'EPA en 
tant qu’enquete telephonique centralisee selon qu'on avait 
recours a linterview telephonique assistee par ordinateur ou 


using paper and pencil methods. While there were no 
cost advantages to CATI over the centralized 
methodology without CATI, CAT! did result in improved 
data quality. Under CATI there were fewer edit 
failures, fewer branching errors, and more complete 
enumeration of persons within households. 


A study of the organization of data collection 
showed that under a mixed organization with central 
telephone interviewers and local interviewers to handle 
non-telephone households and face to face follow-up of 
telephone non-respondents, non-response rates close 
to those of the traditional methodology could be 
obtained, while achieving a 14% reduction in data 
collection costs. 


In terms of frame issues, analysis of telephone 
coverage in Canada revealed that 2% or fewer 
households do not have telephones. Those without 
telephones have markedly different labour force 
characteristics, with higher unemployment rates and 
lower participation rates. Given the accuracy required 
for national LFS estimates, telephone frames do not 
provide adequate coverage. Studies are being 
conducted into dual frame methods combining 
telephone and area frames, and in urban areas, into 
creation of an Address Register —- a comprehensive list 
frame containing residential addresses and published 
telephone numbers. 


Although some new telephone methods have 
already been introduced as a result of the testing 
programme, the major benefit has been to learn and 
build a composite view of the future design and data 
collection methodology to be implemented during the 
post-1991 censal redesign. 


The methodology envisioned is a mixed one with 
respect to frame, mode of collection, organization, and 
possibly technology. The frame is likely to be a dual 
(area-telephone) frame in rural areas, and an Address 
Register in urban areas; mode and _ organization 
collection will likely feature face to face interviewing of 
non-telephone households and _ telephone non- 
respondents by local interviewers and _ telephone 
interviewers working out of the regional offices; and 
technology is likely to be CATI for the centralized 
telephone interviewers, and paper and pencil or 
Computer Assisted Personal Interviewing (CAPI) for the 
local interviewers. 


These components have yet to be tested together, 
but such integrated testing is planned in the research 
phase of the next redesign. 


11.8 Address Register 


The Address Register is a machine-readable list of 
residential addresses in urban areas of Canada. It is 
being created by merging and unduplication of address 
information on administrative records such as 
telephone and electric utility company billing files, and 
municipal assessment rolls. It is being developed 


110 


que linterview était menée normalement avec papier et 
crayon. L’interview teléphonique assistée par ordinateur ne 
présentait aucun avantage du point de vue des couts, mais 
elle améliorait la qualité des donnees. On relevait moins 
d’erreurs de vérification et de branchement et le dénombre- 
ment des membres des ménages était plus complet. 


Il est ressorti d'une etude de |’organisation de la collecte 
des données que, lorsqu’on a une organisation mixte avec 
centralisation des interviews télephoniques et decentralisation 
des interviews pour les ménages sans telephone et pour les 
interviews sur place aupres des personnes n’ayant pas 
répondu a linterview telephonique, on obtient des taux de 
non-réponse voisins de ceux qu’on a avec la methode 
traditionnelle tout en réduisant de 14% le cout de la collecte 
des données. 


Pour ce qui est de la question de la base de sondage, 
une étude du nombre d’abonnés au Canada a montre que 2% 
des ménages ou moins étaient sans telephone. Ces per- 
sonnes ont des caractéristiques relatives a l’activite nettement 
différentes de celles du reste de la population : taux de 
chémage plus eleve et taux d’activite plus faible. Compte 
tenu des exigences de l’enquéte en matiere de fiabilite des 
estimations nationales, les bases de numéros de téléphone ne 
sont pas suffisamment exhaustives. On est en train d’etudier 
la possibilité de constituer une double base de sondage 
combinant les bases de numéros de telephone et les bases 
areolaires et de créer, pour les regions urbaines, un registre 
d’adresses, c’est-a-dire une liste complete des adresses 
domiciliaires et des numéros de telephone publiés. 


Le programme d’essais a déja abouti a l’adoption de 
nouvelles facons d’utiliser l’interview telephonique, mais son 
principal intérét a été de permettre d’envisager les multiples 
possibilités ayant trait au plan de sondage et aux méthodes de 
collecte de données qui seront mis en oeuvre a l'occasion du 
remaniement faisant suite au recensement de 1991. 


La méthodologie envisagée est une methodologie mixte 
quant a la base de sondage, au mode de collecte, a |’organi- 
sation et peut-étre a la technologie. Il s’agira probablement : 
d'une base de sondage qui sera une base double (base 
aréolaire et base de numéros de telephone) dans les régions 
rurales et un registre d’adresse dans les régions urbaines; 
d'un mode de collecte qui comporta, d’une part, des 
interviews en personnes par des intervieweurs locaux aupres 
des meénages sans telephone et des personnes qui n’auront 
pas repondu a |’interview telephonique et, d’autre part, des 
interviews téléphoniques effectuées a partir des bureaux 
régionaux; d’une organisation selon laquelle les intervieweurs 
operant des bureaux régionaux auront recours a l’interview 
telephonique assistee par ordinateur et les intervieweurs 
locaux, a leur crayon et au papier ou a |'interview sur place 
assistée par ordinateur. 


Toutes ces composantes n'ont pas encore été testées, 
mais des essais intégrés sont prévus pour |’étape du prochain 
remaniement qui sera consacrée a la recherche. 


11.8 Registre d’adresses 


Le registre d’adresses est une liste ordinolingue 
d’adresses domiciliaires pour les régions urbaines cana- 
diennes. Pour le constituer, on est en train de fusionner, en 
evitant tout dedoublement, les renseignements sur les 
adresses qui se trouvent dans des dossiers administratifs 
comme les fichiers de facturation des compagnies de 


initially for use in the 1991 Census as an independent 
check on the address lists created in the field by 
Census enumerators. Studies during the research and 
testing leading up to the 1991 Census demonstrated 
that use of the Address Register in this fashion could 
significantly reduce dwelling undercoverage in the 
Census (Drew, Royce, and van Baaren 1989) 


As part of its use during the 1991 Census. the 
Address Register will be updated to reflect additions 
and deletions found during the Census. Following 
1991, it is planned to update the Address Register on 
an ongoing basis, through use of current administrative 
records, and to adopt the Address Register as a frame 
for household surveys in urban areas. In addition to 
being a highly complete list frame, the Address 
Register will contain telephone numbers in cases 
where the telephone numbers are published. 


The presence of telephone numbers for most units 
on the frame will permit the majority of households to 
be interviewed exclusively by telephone, while 
permitting face-to-face follow-up of telephone non- 
respondents. 


Research is required into efficient sample designs 
based on the Address Register frame. Issues to be 
examined include gains from having telephone and 
non-telephone strata, the extent of clustering of the 
sample for each stratum, the desirability of stratification 
of blocks or even dwellings on the basis of Census 
characteristics, population coverage of the Address Re- 
gister and whether sampling strategies will be needed 
to augment its coverage, and sampling strategies for 
dealing with frame changes. 
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telephone et d’électricité et les rdles d’évaluation municipaux. 
On veut d’abord s'en servir en prévision du recensement de 
1991 pour controler les listes d’adresses dressées par les 
recenseurs Sur le terrain. Les études menées a cet egard ont 
montre que l'utilisation d’un registre d’adresses a cette fin 
pouvait réduire considérablement le sous-dénombrement du 
recensement (Drew, Royce et van Baaren, 1989). 


Le registre d’adresses sera mis a jour en cours 
d'utilisation au recensement de 1991. Il est prevu que la mise 
a jour se poursuivra par la suite de facon continue au moyen 
des dossiers administratifs courants et que le registre 
d’adresses servira de base de sondage pour les enquetes- 
menages réalisées dans les secteurs urbains. Outre le fait que 
le registre d’adresses constituera une base de sondage tres 
complete, il contiendra des numeros de telephone qui 
normalement ne sont pas publies. 


Comme on disposera d'un numero de telephone pour la 
plupart des unites de la base de sondage, on pourra mener 
exclusivement des interviews telephoniques aupres de la 
majeure partie des meénages et ne faire des interviews sur 
place qu’aupres des non-repondants. 


ll faut faire de la recherche pour mettre a point des plans 
de sondage efficaces ayant recours a un registre d’adresse 
comme base de sondage. II s’agit de determiner notamment : 
les gains qui découlent du fait de constituer des strates a 
interviews telephoniques et des strates a interviews autres que 
teléphoniques; le nombre de grappes a former dans |’echan- 
tillon de chaque strate; l’'avantage de stratifier les ilots ou 
meme les logements en fonction des caractéristiques de 
recensement; i’exhaustivite du registre d’adresse; et enfin la 
necessité eéventuelle de mettre au point des techniques 
d'échantillonnage qui permettraient de rendre le registre plus 
complet et de reagir aux changements dans la base de 
sondage. 


~) ee SNe eget _ 


pile : ; a in : way, we? Grgniang kh, Digi x eee a) 
Rotem weep anti’ qalert 1 iat eames Gor LeSnntA af) juobn aioe setamtoe =e 7 
LN aRAr WS Sane ape dr lUENtS ager etom 8 oe "ae er ee 
yo SANai). Ab aes un ebb Gaba ie th: me A . palin — nn 
ONS ay “s an Mri ‘ NT fee ee eee NGS Hite «Ne eee an 


= 


el 
. 


sey ig pee gor 


rS oe 


Oe esata! 9! gira fh) OL De esl Lae ipe ; 
Mayr Mine’ no moss Le Siz Bey | 1 Ss a * . . i : wen 
5), AT HAIRS | IG foDl © ese ati sulle 
patent 


Prsoneuny Ea 


t 1 


a Nick estan clnanehails " er 5 
ee Wp WI ea” ai Se hs Segre \ iil ry ‘ei 


“darto ut ie OT eal ut mi Lege albino ae toon on aw AERO 2 i. 
: ° wen = s* : 5 ; * Y 
Bs Meer ed Le ‘> a= na sh fasinates 
wovtitak > OROOA Gusk oie ie ite 18 cmbep tte = c [20a sxobAnedh Oni Deeadene ' 
nelrgnt 8 FeO tea Mie eagle sty mapper ST SS Sire " oa p : i fe ATER 
wthe TAS “Slr, HBS oe fe Ao re a Pao x ae _ Ne Ge ui eR Peer ofS OPS tat ARK AAI TOP at) © 
UG MANNS PEPE Sule OB ae NAY eh Hetty) CPR ny Dh — Tee nBentetame abwlgnier ws 
; We Wr shah minh & Seok iy Paha ty | H ei KVP oae 4 ts 1 ah “tae eR We nar ma aity aNSCIe i - 
J -Bkwl eg) centttald oth aelagie | oie aie Se ae i weet iio: pba OUEhICOg 2occnnlanene 
ty BOOHER 25) weep n sina eal ennai SNAP iaaidinci _~— 
6) (rte me (Beehive De oritiog ric: Gln davemmghin® ' “Heys ayes HRN » a ot en ime TN AGO Med HBR IO" 91 — | 
a Bre nee | eS = in, RNS qa pe 2 So rokmpnadverygnt atten grillggtanin gs ip 


hg eee ah aera, GIS ail or ral ae = “rout IND ub ire a ve ays ees Ela ee oe rebel oT ar Oe 
sity wtih aie eh ls. 0, Ais ya hay, AROS 2 wo’ OS ace £2 Ww sere BP ontasingay | 
ae sehichs > = ee? aot et =e a tee =e 2004 Gace! 
,; Fa 
in SOLAR tees wtf own ear Wile 


a poe ns These le -aelinielan Cera 

' ae ed YRmete fa agud prateibtunyer 

ie i 9 a pot Sul sam ww Ose Soettio Pea 
* Peon . ioe wie Ga Reha Sete i= 10g 
/ a nie | , ae co, Gye! Fy | a os o(jt> -t wes Game ee qaplens Whetige 


‘. : Biss o Hy 290 Jip oftiloees + inn) Greek Wine api ese 
: on heres ee eS pla fee Whavijriitenhe (Oca anes 
a i" ig thkew car & EA ema 4) Tee ep aerns aol raat 
jag sts Serle ear eT SAAT ae es 
ah soc maar. © ae. 3 core Get Suieaur 
el 8 pa ages fre “OnShTe Weed Stale et Lagat 
Aa eo snaphge ie a re ele aL 
Sas mex re Serta’ ¢ mp rina 
iat ace So io eae “Ahr eur gip. y 
- a — : 
’ ~~) a ODS. (are Vie “Me 166i ®, 
= O46. THig ten 96S Bow mays wll cRchlie ll 
ns Mawes =N), (oie? O12 iS 
ae er! 
> * “ae . 
=r s Ps ot 
eax jz tine r me cABine ‘ eur da@latt-d 9 .4re 7 conLacgtingne 
eis pA foe Fe eee are Oe Lure Hi my. alle OS _ebgmenge npc aa 
‘tne 2 : Le oc ‘= Sek Ps eth ay" Wve yeahs [ALe . piviview,, @2 pene e4 J oe wey... 
esos ao ae inte lt *, bad van egrere ~ Gir lee 
fea ce5 TS eee ee ae aie os oo a ie hk Sa ct halt : 
oy oe = ~ 


a + hel = Ree ee Cor payron: ide 
i> ai ity 


Appendix A 


Numbering System 


1. Introduction 


The numbering system assigns a unique 17-digit 
number to each individual in the sample and contains 
all the design information required for estimation and 
tabulation. Since each individual is uniquely identified, 
it also permits the linking of data for individuals across 
months for the purpose of longitudinal analysis. In 
brief, the 17-digit numerical identification can be 
broken down into seven fields, which are described 
below. 


Annexe A 


Systeme de numérotation 


1. Introduction 


Le systeme de numérotation attribue un numéro a dix- 
sept chiffres a chaque personne qui fait partie de |’echantillon, 
et il contient tous les renseignements relatifs au plan de 
sondage necessaires a |’estimation et a la totalisation des 
données. Comme chaque personne a un numero qui lui est 
propre, ce systeme permet de faire le couplage des données 
d'un mois a un autre a des fins d’analyse longitudinale. Le 
numéro d’identification se compose de sept zones dont la 
description est la suivante. 


Identifies 


Field No. Name 
Position 
N° de zone Nom Description 
1 1-5 PSU -UPE Province, Economic Region, Stratum and Primary Sampling Unit. — 
Province, region economique, strate et unite primaire d’echantillonnage 
2 6-7 Group - Second Stage Sampling Unit in NSR Rural Areas. — Unite du deuxieme 
Groupe degre d’echantillonnage dans les regions rurales des secteurs NAR. 
3 8-10 Cluster - Second Stage Sampling Unit in NSR Urban and in SR areas. — Unite du deuxieme 
Grappe degre d’échantillonnage dans les regions urbaines des secteurs NAR et les secteurs 
AR. 
4 Wal Rotation - Number governing month in which sample rotation occurs. — 
N° de Chiffre qui indique quel mois le renouvellement de |’echantillon a lieu. 
renouv. 
12-14 List - Liste Dwelling List Number. — Numero de liste du logement. 
6 ils) Multiple Additional dwellings within selected units found at interview time. — 
Logements supplementaires dans les unites echantillonnees dont on prend 
connaissance au moment de |’interview. 
7 16st Page-line — Person as listed on the Household Record Docket. — Personne telle 
Pagel/ligne qu’identifiee dans le dossier du menage. 


The first digit of the PSU consists of the province 
as follows: 


Newfoundland 
Prince Edward Island 
Nova Scotia 

New Brunswick 
Quebec 

Ontario 

Manitoba 
Saskatchewan 
Alberta 

British Columbia 


OONONAWMH-O 


Although the LFS does not sample in the Yukon or 
Northwest Territories, for the purposes of testing or for 
special surveys using the LFS system, the Yukon is 
usually assigned to Province | 9 and the Northwest 
Territories to Province 8. This corresponds to the 
regional office designated to cover each area. 


Le premier chiffre de la zone reservee a |'UPE designe la 
province, et les codes employes sont les suivants : 


Terre-Neuve — 
lle-du-Prince-Edouard 
Nouvelle-Ecosse 
Nouveau-Brunswick 
Quebec 

Ontario 

Manitoba 
Saskatchewan 

Alberta 
Colombie-Britannique 


OONONRWMH OO 


On ne preleve pas d’échantillon pour |'EPA au Yukon ni 
dans les Territoires du Nord-Ouest, mais pour les essais et les 
enquétes spéeciales menees au moyen de |’EPA, le Yukon est 
généralement associé a la province 9 et les Territoires du 
Nord-Ouest, a la province 8, car ce sont les bureaux régionaux 
situes dans ces provinces qui s’occupent respectivement de 
ces territoires. 


The second digit of the PSU is the Economic 
Region. One anomaly exists in this identification. The 
numbering system was originally designed to have 
only one digit for the ER, allowing for ten ERs per 
province. In the current design there are 14 ERs in 
Quebec and 11 in Ontario, necessitating the collapse of 
some ERs. 


The weighting system has been converted to allow 
a three-digit Economic Region (including province) to 
be used in the final estimation and _ tabulation 
procedures. In order to assign ERs for those PSUs 
where the numbering system has been collapsed a 
table has been built to convert PSUs to ERs. Creating 
this table was more expedient than changing the 
numbering system due to the impact on all systems 
and databases in the LFS. Those PSUs not found in 
this table have ER values that are generally written as 
three-digit numbers, the first two digits from the PSU 
and the third digit zero. 


PSU Ranges with Non-Standard Economic Regions 
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Le deuxieme chiffre de la zone UPE représente la région 
économique. Il y a une anomalie a cet egard. A l’origine, on 
n’avait prévu qu'un chiffre pour les régions economiques 
parce qu'on pensait qu'il n’y en aurait que 10 par province. 
Dans le plan actuel, il y a quatorze RE au Québec et onze en 
Ontario, de sorte qu’on est obligé de grouper certaines d’entre 
elles. 


Le systeme de pondération a été modifié de maniere a ce 
qu'on puisse attribuer un code a trois chiffres aux regions 
économiques (province incluse) au moment de la production 
des derniéres estimations et totalisations. Afin qu'il soit 
possible d’attribuer un code de région economique aux UPE 
qui ont été regroupeées pour les besoins du systeme de 
numérotation, un tableau de conversion a eté mis au point 
(voir en annexe). Il était plus facile de proceder ainsi que de 
modifier le systeme de numérotation, car cela aurait eu des 
consequences sur tous les systemes informatiques et bases 
de données de |’EPA. Le code des UPE qui ne se trouvent 
pas dans le tableau est généralement un numero a trois 
chiffres, dont les deux premiers identifient ’UPE et le 
troisieme est un zero. 


Tranches de UPE pour les regions economiques avec code a 
trois chiffres 


PSU Range ER PSU Range ER 
Tranche de UPE RE Tranche de UPE RE 
41000 41019 411 46240 46249 463 
41020 41059 412 46250 46299 464 
41100 41199 412 46300 46699 461 
41200 41299 411 46700 46799 463 
46000 46039 461 46800 46809 461 
46040 46059 463 46810 46899 464 
46060 46099 464 59000 59039 591 
46100 46199 462 59040 59059 592 
46200 46219 461 59100 59699 591 
46220 46239 462 59700 59899 592 


2. Basic LFS Strata 


The detailed significance of the first three fields 
varies according to the basic type of design stratum 
involved. There are four basic types: NSR, SR non- 
apartment, SR apartment and Special Areas. These 
area types can be identified by the sixth and seventh 
digits as shown in the table below. 


Note that the 50s are not mentioned in the table. 
This range was reserved for special categories of non- 
LFS units that may be added to the database from time 
to time. For instance, the Family Expenditure Survey 
regularly conducts interviews in both Whitehorse, Y.T., 
and Yellowknife, N.W.T. and has been assigned group 
numbers in this range. 


It is also worth noting that the third digit identifies 
NSR, SR and Special Areas but does not distinguish 
SR apartment from non-apartment strata. 


2. Strates de base de l’EPA 


La signification des trois premieres zones varie selon le 
genre de strate dont il s’agit. Fondamentalement, il y a quatre 
genres de strates : les secteurs NAR, les secteurs AR sans la 
base d’appartements, les secteurs AR avec’ base 
d’appartements et les secteurs spéciaux. Le genre de strate 
est indiqué par le sixieme et le septieme chiffres, comme on 
peut le voir dans le tableau qui suit. 


On remarquera que la cinquantaine est absente du 
tableau. Elle a été réservée a des catégories spéciales de 
groupes non sélectionneés pour |’EPA qui peuvent étre ajouteés 
a la base de données a l’occasion. Ainsi, pour |’enquéte sur 
les dépenses des familles, il se fait réguliérement des 
interviews a Whitehorse (Yukon) et a Yellowknife (T.N.-O.) et 
on attribue aux groupes sélectionneés un code entre 50 et 60. 


Il convient de signaler egalement que le troisieme chiffre 
identifie les secteurs NAR, AR et spéciaux mais qu’il ne fait 
pas la distinction entre les strates AR formees sans la base 
d’appartements et celles formées a partir de la base 
d’appartements. 
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Type of Area 


Genre de secteur 


Sixth-Seventh Digits 


Sixieme et septieme chiffres 


Third Digit 


Troisieme chiffre 


NSR - NAR 

SR - AR 

Apartment - Base d’app. 
Special Area - Spécial 


11-49 0 
61-84 1-8 
91-96 1-8 
01-10 ) 


In the following sections the detailed numbering 
system for each area type is described. 


3. NSR Areas 


As in previous designs the stratification of NSR 
areas is designated by ranges of PSUs. The last two 
digits of the PSU field are interpreted as follows: 


Le systeme de numérotation pour chaque genre de 
secteur est decrit en détail dans les sections qui suivent. 


3. Mode de numeérotation des UNAR 


Comme dans l’ancien systéme, la stratification des sec- 
teurs NAR est représentee par des tranches de numeéros dans 
la zone reservée aux UPE. Voici comment interpréter les 
chiffres dans ces tranches, en avant-derniere et derniére 
position de la zone UPE : 


Stratum Range 
Strate Tranche 

1 01-19 

2 21-39 

3 41-59 

4 61-79 

5 81-99 


A new PSU category has a value of 99 in the last 
two digits. Seven PSUs in the LFS have a special 
design as follows: 


ll y a une nouvelle categorie d’UPE dont les deux derniers 
chiffres sont 99. Sept UPE de I’EPA ont un plan de sondage 
special. Ce sont: 


PSU Design 


UPE Plan 

25099 Random Group/Six selections - Groupe aleatoire/six unites 

53099 Random Group/Six selections - Groupe aleatoire/six unites 
57099 Buffer/Random Group/Two selections - Tampon/groupe aleatoire/ deux unites 
73099 Buffer/Random Group/Two selections — Tampon/groupe aleatoire/ deux unites 
83099 Buffer/Random Group/Two selections - Tampon/groupe aleatoire/ deux unites 
86099 Buffer/Random Group/Two selections — Tampon/groupe aleatoire/ deux unites 
98099 Random Group/Six selections - Groupe aleatoire/six unites 


The buffer areas were set up to provide the 
capacity of updating NSR areas just outside of major 
cities where no rural census subdivision was included 
in the CMA boundaries. Two EAs are selected within 
the buffer area by the random group method. The 
buffer around Windsor (57099) allows a more equitable 
comparison between the current design estimates and 
the old design estimates for this CMA. The CMA 
associated with these buffers start with a PSU number 
equal to the buffer PSU number plus one. 


On a creé des zones tampons pour permettre de faire la 
mise a jour de |’échantillon dans les secteurs NAR juste a 
l'extérieur des grandes villes dans les limites desquelles il n'y 
avait pas de subdivisions de recensement rurales. Deux SD 
ont été choisis dans ces zones tampons par la methode des 
groupes aléatoires. La zone tampon autour de Windsor 
(57099) permet de faire des comparaisons plus justes entre 
les estimations relatives a cette RMR selon le plan de 
sondage actuel et les estimations selon |’ancien plan de 
sondage. Le code des RMR associées a ces zones tampons 
commence par un code d’UPE qui est le code d’UPE de la 
zone tampon plus 1. 


The other PSUs in this category are in Economic 
Regions that have an insufficient NSR population for 
normal PSU formation. Six EAs are selected with the 
random group method. All seven PSUs in this new 
category are strictly rural. 


The group number identifies the area sub type. 
Groups 11-19 are urban groups and 21- 49 are rural 
groups. In urban areas the clusters generally 
correspond to city blocks and are numbered from 001 
to the number of clusters formed in that town or city. In 
rural areas most clusters will be 000 corresponding to 
the EA design in this area (i.e., no clustering). If the 
EA had to be split after selection of the group to 
provide 6 rotations per PSU, then the two clusters so 
formed would be numbered 001 and 002 and both 
would be selected. 


In the PSUs ending in 99, the group refers to the 
random group to which the cluster was assigned; the 
cluster identifies the selected EA. 


4. SR Areas 


The first three digits of the PSU will generally 
identify the city involved. This is the SRU number, 
often called the SRU. For example, SRU 011 is St. 
John’s, NFLD. It is the first or largest city in Economic 
Region 010. All identifications starting with 011 will be 
located within the CMA of St. John’s. The largest cities 
require more than one SRU number, as follows: 
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Les autres UPE sont dans des régions economiques dont 
les secteurs NAR ont une population insuffisante pour qu'on 
puisse y former des UPE normalement. Six SD sont choisis 
par la méthode des groupes aléatoires. Les sept UPE de cette 
nouvelle catégorie sont entierement rurales. 


Le code de groupe identifie le genre de sous-secteur. 
Les groupes 11 a 19 sont des groupes urbains et les groupes 
21 a 49, des groupes ruraux. Dans les régions urbaines, les 
grappes sont généralement des ilots, et elles sont numérotees 
a partir de 001 jusqu’a concurrence du nombre de grappes 
formées dans la ville en question. Dans les regions rurales, le 
code de grappe est la plupart du temps 000, compte tenu du 
plan de sondage des SD (pas de grappe). Si, apres la 
sélection du groupe, il a fallu diviser le SD pour obtenir six 
groupes de renouvellement par UPE, les deux grappes ainsi 
formees portent les codes 001 et 002 et elles sont choisies 
toutes les deux. 


Pour les UPE dont le code finit par 99, le code de groupe 
désigne le groupe aléatoire auquel la grappe a ete attribuee et 
le code de grappe, le SD choisi. 


4. Mode de numeérotation des UAR 


Les trois premiers chiffres de la zone UPE identifient 
géneralement la ville. Ils forment le code de |’'UAR. Par 
exemple, le code d’'UAR 011 désigne St. John’s (Terre- 
Neuve). C’est la premiere ou la plus grande ville de la région 
économique 010. Toutes les unites d’échantillonnage dont le 
code commence par 011 sont situeées dans la RMR de St. 
John’s. Les grandes villes repréesentées par plus d’un code 
d'VAR sont les suivantes. 


CMA SRU Numbers 
RMR Code d'UAR 
Montreal 461, 462 

Toronto SS), BS 

Winnipeg 611, 661, 671, 672 
Edmonton 861, 862 
Vancouver hom mchoye) 


Another exception exists in SRU 468. The num- 
bering system allows eight different SRU codes within 
the two-digit ER 46. There are, in fact, four ERs 
starting with 46: 461;462;463;464. The SRU sample in 
these four ERs consists of eight cities, but Montreal 
requires two SRU codes as shown above. Hence, the 
smallest two cities have to share the SRU number as 
follows: 


L’'UAR 468 constitue une exception. Le systeme de 
numeérotation prévoit huit codes d’UAR différents pour le code 
de RE 46. Dans les faits, il y a quatre RE dont le numéro 
commence par 46, les RE 461, 462, 463 et 464, et huit UAR 
(villes) dans ces quatre RE; cependant, comme nous |’avons 
vu plus haut, il faut deux codes d’UAR pour Montreal. Les 
deux plus petites villes doivent donc partager le code d’UAR 
468. 


PSU City 

URE Ville 
46801-46802 Valleytield 
46811 Joliette 


Please note that the third digit equal to 9 is already 
reserved for the Special Areas. 


Il faut noter que le chiffre 9 en troisieme position est déja 
reserve aux secteurs spéciaux. 


The fourth digit of the PSU number identifies a 
contiguous geographic stratum within certain SRUs 
The larger cities can have as many as 19 of these 
"super strata", hence the need for more than one SRU 
number. The fifth digit identifies the sub- unit (also 
called PSU) that was formed within these super strata 
The SRU design limits the fifth digits to 1-9 since 0 is 
reserved for the Apartment frame. The number of sub- 


a in a super stratum is typically between three and 
Ive. 


Small cities do not have a large enough sample for 
this level of stratification. All but one have the fourth 
digit equal to zero. The exception is another anomaly. 
Fredericton is too small to have super strata and yet it 
was designed with eleven PSUs numbered 
consecutively from 34101 to 34111. Thus it looks like 
it has two super strata, which is not true, and PSU 
34110 looks like an Apartment frame PSU, which it is 
not. 


As before the group identifies a random subset of 
the clusters in a PSU and only one cluster is selected 
per random group. In the outskirts of larger cities a 
cluster can be an entire EA; elsewhere, it is typically a 
city block. 


5. Apartments 


As in SRUs, the first four digits of the PSU identify 
the location of the Apartment building in terms of the 
super stratum. The fifth digit is always zero. (PSU 
34110 is the only exception to the reverse rule that 
Self-Representing PSUs ending in zero are part of the 
Apartment design.) 


The PSU number in this design is only a location 
identifier since the sampling scheme does not use the 
PSU number in the stratification process. Generally, all 
apartment buildings in a city are listed sequentially, 
with cluster numbers 001 to the number of buildings in 
total. The group numbers alternate between 91 and 92 
for each successive cluster selection. 


In some cities there are enough clusters to assign 
size strata in this frame. The group number identifies 
the size stratum as follows: 
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Dans certaines UAR, le quatriéme chiffre de la zone UPE 
designe une strate constituée de secteurs de recensement 
contigus. Les grandes villes peuvent avoir jusqu’a 19 de ces 
“superstrates". Elles ont par conséquent besoin de plus d’un 
code d'UAR. Le cinquiéme chiffre identifie les sous-unités 
(aussi appelées UPE) formées a l'intérieur de ces 
superstrates. Selon le systeme de numérotation, le cinquiéme 
chiffre peut varier de 1 a 9 seulement, le chiffre 0 étant 
reserve a la base d'appartements. En général, il y a entre trois 
et cing sous-unités dans une superstrate. 


L’échantillon prélevé dans les petites villes est trop petit 
pour qu’on puisse le soumettre a ce niveau de stratification. 
Toutes sauf une ont le chiffre 0 en quatriéme position. 
L’exception constitue encore une fois une anomalie. 
Fredericton est trop petite pour avoir une superstrate, et 
pourtant on y a cree 11 UPE ayant pour code les numeéros 
conseécutifs allant de 34101 a 34111. On a donc l'impression 
qu'elle a deux superstrates, ce qui n'est pas le cas, et on 
pourrait croire que |'UPE 34110 a ete prélevée dans une base 
d’appartements, ce qui n'est pas le cas non plus. 


Comme dans les UNAR, le code de groupe identifie un 
sous-ensemble aleatoire de grappes dans une UPE, et une 
grappe seulement est choisie par groupe aleatoire. Dans la 
peripherie des grandes villes, la grappe peut étre un secteur 
de denombrement complet; sinon, c’est en general un ilot. 


5. Mode de numeérotation des UAR de la base 
d’appartements 


Comme dans le cas des UAR, les quatre premiers chiffres 
de la zone UPE indiquent l'emplacement de |'immeuble 
d’appartements du point de vue de la superstrate. Le 
cinquieme chiffre est toujours un zero. (Nota : l'UPE 34110 
est la seule exception a la regle selon laquelle les UPE des 
UAR dont le code finit par zero ont ete formees dans la base 
d’appartements.) 


Dans ce mode de numerotation, les chiffres dans la zone 
UPE permettent uniquement d’identifier |‘’emplacement, car !a 
méthode d’échantillonnage n’utilise pas le code d'UPE aux 
fins de la stratification. En genéral, on inscrit les immeubles 
d’appartements d'une ville sur la liste dans l’ordre, l'un apres 
l'autre, et on leur attribue un code de grappe en commencant 
par 001 et en allant jusqu’au nombre total d'immeubles dans 
la liste. Le code de groupe alterne entre 91 et 92 a chaque 
grappe échantillonnee. 


Dans certaines villes, il y a suffisamment de grappes dans 
cette base pour qu'on puisse former des strates selon un 
critere de taille. Ces strates sont representees par les codes 
de groupe suivants. 


Standard Size 


Group Numbers 


Codes de groupe 


Taille standard 
des strates 


Toronto Size 
Stratum Stratum 
Taille des strates 

a Toronto 


91-92 
93-94 
95-96 


30-99 units — unites 
100+ units - unites et plus 


30-99 units -— unites 
100-199 units -— unites 
- 200+ units — unites et plus 


In Toronto and Montreal there are also geographic 
strata identified by sets of super strata. The use of 
super stratum for the PSU _ field implies that 
"PSU + Cluster" is no longer a unique identifier, as it is 
in the SRU. Group numbers are required to identify 
the size stratum. The advantage appears when the 
clusters are assigned to interviewers at the super 
stratum level. 


6. Special Areas 


The PSU number can only identify the ER where 
the Special Area unit is located. In most areas the 
frame is not stratified at the ER level. The second digit 
is almost always zero. The exception is in the design of 
the Alberta-remote, where the second digit can have 
two possible values of 7 and 8 corresponding to the 
two remote strata in that province. 


The ER number for each Special Area unit will be 
identified by digits 4 and 5 of the PSU. This, 
combined with the first digit (Province), will yield the 
full three-digit Economic Region. 


The two major area subtypes are denoted by the 
group number: 01 defines the Military/Institutional 
frame and 03 defines the Remote Area frame. 
Additionally, the special Quebec Urban Remote frame 
uses group numbers 04 to 10, one for each urban area 
in the frame. 


The cluster number determines the EA selection 
within a Special Area stratum. The clusters are 
assigned sequentially on a list of the EAs sorted by 
descending order of size. If one of the selected EAs is 
actually clustered, the cluster number is revised to a 
new value outside the range of the main list of EAs. 
Usually the first clustered selection is numbered from 
101 to 106, for example, and the second may have 
201-202. (Note: Very few Special Area EAs are 
actually clustered; all are remote.) 


In the Quebec Urban Remote frame each of the 
two selected urban areas is divided into six clusters, all 
of which are selected and numbered sequentially from 
001-006. 


7. Rotation Number 
The rotation number is also known as the rotation 


group or just the rotation. It governs the month of 
introduction of the selected dwellings within the cluster. 
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A Toronto et a Montréal, il y a aussi des strates géogra- 
phiques représentées par des tranches de chiffres a |’intérieur 
du code des superstrates. L’utilisation du code de superstrate 
dans la zone d'UPE signifie que le code d’UPE et le code de 
grappe ne constituent plus, ensemble, un_ identificateur 
unique, comme dans le cas des UAR. On a besoin du code 
de groupe pour identifier la strate formee selon le critere de 
taille. L’avantage de ce mode de numerotation ressort lorsque 
les grappes sont attribuees aux intervieweurs au niveau de la 
superstrate. 


6. Mode de numérotation des secteurs speciaux 


Les chiffres inscrits dans la zone UPE_ indiquent 
uniquement la RE ou le secteur spécial echantillonne est 
situee. Dans la plupart des secteurs, la base n'est pas 
stratifige au niveau de la RE. Le deuxieme chiffre est presque 
toujours zéro. La seule exception est la base des regions 
éloignées de |’Alberta, ou le deuxieme chiffre, qui represente 
les deux strates de régions éloignées de cette province, peut 
avoir deux valeurs possibles, 7 ou 8. 


Les chiffres en quatrieme et en cinquieme position de la 
zone d’UPE identifient la RE de chaque unité des secteurs 
spéciaux. Combinés au premier chiffre (code de la province), 
ils constituent le code a trois chiffres complet de la région 
économique. 


Le code de groupe identifie les deux principaux types de 
sous-secteurs : 01 désigne la base militaire/institutionnelle et 
03, la base des régions éloignées. Il y a en outre la base 
spéciale des régions éloignées du Québec, dont chaque 
région urbaine porte un code de groupe allant de 04 a 10. 


Le code de grappe désigne le SD choisi dans la strate 
des secteurs speciaux. Ce code est un numéro sequentiel 
attribué aux SD classés par ordre décroissant de taille. Si un 
des SD choisis est subdivise en grappes, on attribue a celles- 
ci un code de grappe dont la valeur ne figure pas dans la 
principale liste de SD. En général, on attribue au premier SD 
subdivisé en grappes les codes 101 a 106 et au deuxieme, les 
codes 201 et 202. (Il convient de noter que tres peu de SD 
dans les secteurs spéciaux sont subdivisés en grappes. Il 
s’agit dans tous les cas de régions éloignées.) 


Dans la base des régions éloignées du Québec, les deux 
régions urbaines choisies sont subdivisées en six grappes qui 
sont toutes échantillonnées et qui sont numérotées dans 
l’ordre de 001 a 006. 


7. Numéro de renouvellement 


Le numéro de renouvellement, attribué aux grappes, 
determine le mois ou les logements choisis dans les grappes 
sont introduits dans |’échantillon. Les mois auxquels 
correspondent les numeéros de renouvellement sont indiqués 
ci- apres. 


The correspondence is shown below: 
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Rotation Number 


Numéro de 
renouvellement 


Months of Introduction 


Mois d’introduction 


Oanafr Wh — 


January, July - Janvier, juillet 
February, August — Février, aout 
March, September - Mars, septembre 
April, October - Avril, octobre 

May, November — Mai, novembre 
June, December -— Juin, décembre 


For each month of the LFS, one of the six rotations 
thus represents all the dwellings that have just been 
introduced for this month. This is variously called the 
birth rotation for the month, the birth month for the 
dwelling and the birth dwellings for the month. 


Some of the dwelling lists represented by PSU- 
Group-Cluster may be selected in two different 
rotations over the life of a PSU. Typically this occurs in 
NSR Rural Groups. The identifications are different and 
yet they physically share the same list of dwellings on 
the LFS data base. They are called linked or shared 
clusters. The separate identifications allows the double 
sampling of the list, although care has to be taken to 
avoid overlapping the dwelling selections. 


The cluster identification specifically refers to the 
third field of the numbering system. In general, the 
entire set of PSU-Group-Cluster-Rotation is also called 
the cluster since this set of numbers is used as the key 
field for the LFS data base. 


8. Ciuster Lists 


In the normal process the land area (or apartment 
building or institution) represented by the PSU-Group- 
Cluster is investigated in the field and every dwelling 
found in the area is listed with a unique civic address 
or an address description. The listing number identifies 
the sequence of dwellings on this list. Each listing 
number represents a separate dwelling which may or 
may not contain a household to be interviewed. 


Occasionally the person listing the dwelling does 
not realize that there more than one dwelling located at 
that address. Upon interviewing in the dwelling all such 
extra dwellings are listed on a separate line for data 
capture but with the same listing number. The multiple 
number allows up to nine such dwellings to be 
captured for each original listing. 


Chaque mois ou |’'EPA a lieu, un des six numeéros de 
renouvellement designe tous les logements introduits dans 
l'echantillon ce mois-la. On parle dans ce contexte du numéro 
de renouvellement des logements introduits ce mois-la, du 
mois de renouvellement des logements et des logements 
introduits dans |’echantillon ce mois-la. 


ll arrive que certaines listes de logements portant un code 
d’UPE, de groupe et de grappe donne fassent partie de deux 
groupes de renouvellement differents pendant la période 
active d'une UPE. Cela se produit généralement dans les 
groupes ruraux des secteurs NAR: leur numero d’identi- 
fication est different et pourtant ils figurent sur la méme liste 
de logements dans la base de données de |’EPA. On les 
appelle des grappes enchaineées. Le fait de leur donner un 
numero d’identification different permet d’echantillonner la 
liste deux fois, quoiqu’il faille faire attention de ne pas prelever 
les memes logements deux fois. 


Le code de grappe est la troisieme zone du systeme de 
numerotation. En général, on appelle aussi le numero forme 
par le code d’UPE, le code de groupe, le code de grappe et le 
numero de renouvellement le code de grappe, car il s’agit de 
la zone clé en ce qui concerne la base de donnees de |'EPA. 


8. Listes de grappes 


Selon le processus normal, toute superficie (ou immeuble 
d'appartements ou établissement) representee par un code 
d'UPE, de groupe et de grappe est visitee par le personnel 
sur le terrain qui dresse la liste des logements qui s’y trouvent 
en indiquant pour chacun soit son adresse de voirie, soit une 
description de l’endroit ou il est situe. Le numero de liste suit 
l'ordre dans lequel les logements sont inscrits sur la liste. 
Chaque numero de liste correspond a un logement distinct qui 
peut contenir ou non un menage a interviewer. 


ll arrive que la personne chargee de dresser la liste de 
logements ne se rende pas compte qu'il y a plus d'un 
logement a une adresse donnée. Lorsqu’on interview le 
meénage, on ajoute les autres logements sur une ligne distincte 
pour la saisie des données mais on leur attribue le meme 
numéro de liste. Le code attribue au logement additionnel 
découvert dans un immeuble a logements multiples permet de 
saisir les données se rapportant a un maximum de neuf 
logements par logement releve au depart. 


Sampling of the cluster lists generates a set of 
dwellings represented by identification of PSU-Group- 
Cluster-Rotation-Listing-Multiple. This identification is 
then converted to a separate but also unique 
numbering system listing the Regional Office and 
Docket Number (RO-Docket). These docket numbers 
are sequentially assigned as the sample is added to 
the Response file that controls the flow of documents 
from this point onward. A check digit is added after the 
sequential number to provide an eight-digit reference 
item. 


9. Individuals 


One can use either the PSU-Group-Cluster-Rota- 
tion-Listing-Multiple or the RO- Docket number to 
proceed from the household identification to the 
individual. Within the household, all individuals are 
listed on the Household Record Docket on one or more 
pages, with each individual on a separate line of the 
docket. Thus the identification refers to these 
individuals as page-line entries. 
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Lorsqu’on échantillonne les listes de grappes, on obtient 
un ensemble de logements representés chacun par un 
numéro composé des codes d’UPE, de groupe, de grappe, de 
renouvellement, de liste et de logement dans un immeuble a 
logements multiples (UPE-Groupe-Grappe-Renouvellement- 
Liste-Multiple). Ce numéro d'identification est converti en un 
autre numéro également unique, le numero de bureau régional 
et de dossier (BR-Dossier). Ce numéro d’ordre est attribue 
aux unités de I’échantillon au fur et a mesure qu'on les ajoute 
au fichier des réponses qui controle le flux des documents a 
partir de ce point. Un chiffre de controle est ajoute a ce 
numéro d'ordre, ce qui donne un numéro de reference a huit 
chiffres. 


9. Individus 


ll est possible d’utiliser les codes des "UPE-Groupe- 
Grappe-Renouvellement-Liste-Multiple" ou les codes des 
"BR-Dossier" afin d'identifier les individus d’un menage. 
Tous les individus d'un méme ménage sont enumereés dans le 
dossier du ménage sur une ou plusieurs pages en inscrivant 
un individu par ligne. Aijnsi, l'information relative a chaque 
individu peut étre referee par un numero de page et de ligne. 


Appendix B 


Sample Size Stabilization 


1. Introduction 


The stabilization program was instituted in 1977 to 
limit the growth of the LFS sample. The number of 
newly sampled dwellings (births) selected each month 
was limited to a previously set value called the base 
figure. In the previous design each major category of 
the sample within each province was given a separate 
base figure. The categories were 


Self-Representing Non-Apartment (SR Regular) 


Self-Representing Apartment (SR Apt) 
Non-Self-Representing Urban (NSR-Urban) 
Non-Self-Representing Rural (NSR-Rural) and 
Special Areas (SPE). 


Not all areas were stabilized. All Special Areas 
were left unstabilized as were some of the smaller SR 
areas. The definitions of the areas were hard coded 
into the software that performed the sampling of 
dwellings from LFS clusters. In order to alter the 
definition of stabilization areas a program modification 
proposal was necessary. This ensured that all 
components of the system received the same changes. 


The actual dropping of dwellings was performed 
according to the following algorithm. First, the off- 
rotation clusters and the clusters with sub-weights due 
to large growth were identified. Off-rotation clusters 
are those introduced in a month other than that 
dictated by the rotation number. Such clusters occur 
mostly in the open-ended Apartment frame in order to 
sample dwellings as soon as newly added clusters 
become selected. 


Clusters with sub-weights were counted in the 
sample size for the stabilization area but no dwelling 
selections within these clusters were eligible for 
dropping and none of these clusters actually received 
the stabilization weight. The stabilization weight applied 
to the remaining clusters was calculated using 


where: 

Wis the weight 

N_ is the original count of selected dwellings 

Bis the base figure 
Cis the count of selected dwellings in sub-weighted 


clusters and 


Annexe B 


Stabilisation de la taille de l’é@chantillon 


1. Introduction 


Le programme de stabilisation a été institué en 1977 pour 
limiter la croissance de l’échantillon. Le nombre de nouveaux 
logements échantillonnés chaque mois était limite a une 
valeur etablie d’avance appelée allocation de base. Dans 
l'ancien plan de sondage, il y avait une allocation de base 
distincte pour chaque grande catégorie d’échantillon dans 
chaque province. Les catégories étaient les suivantes : 


Secteur autoreprésentatif, sans la base d’appartements (AR- 
norm.) 

Secteur autoreprésentatif, base d’'appartements (AR-app.) 
Secteur non autorepresentatif, region urbaine (NAR-urb.) 
Secteur non autorepresentatif, region rurale (NAR-rur.) 
Secteurs speéciaux (SPE). 


Les secteurs n'éetaient pas tous soumis au programme de 
stabilisation. Les secteurs spéciaux de méme que les petits 
secteurs autorepresentatifs sans base d’appartements ne 
l'etaient pas. La définition des secteurs était integree au 
logiciel qui permettait de prélever l’'echantillon de logements 
dans les grappes de |’EPA. Pour changer la definition d'un 
secteur de stabilisation, tI fallait soumettre une proposition de 
modification de programme afin que le changement soit 
apporte a toutes les composantes du systeme. 


Le retrait des logements se faisait selon l’algorithme sui- 
vant. Premierement, les grappes hors-renouvellement et les 
grappes sous-pondeérées en raison d'une forte croissance de 
la population étaient mises en evidence. Les grappes hors- 
renouvellement sont les grappes introduites un mois autre que 
celui indiqueé par le numéro de_ renouvellement; elles 
proviennent principalement de la base ouverte d’appartements 
d’ou elles ont été prelevees pour que les logements puissent 
étre echantillonnées aussitot que les grappes nouvellement 
ajoutées ont ete choisies. 


Les grappes sous-pondérées etaient prises en compte 
dans la taille de l’'échantillon des secteurs de stabilisation, 
mais aucun des logements preleves dans ces grappes ne 
pouvait étre retire et aucune de ces grappes ne se faisait 
attribuer un poids de stabilisation. Le poids de stabilisation a 
appliquer aux grappes restantes etait calcule par la formule : 


West le poids 

N_ est le nombre de logements choisis au depart 

Best |l’allocation de base 

C est le nombre de logements choisis dans les grappes 
sous-ponderees 


and p_ is the province 
jis the stabilization area 
m is the rotation month 


The number of dwellings to drop was thus (N-B). 
The drop was systematically applied to the file of (N-C) 
dwellings. If N was less than B then no stabilization 
was applied to that area for that month. The result was 
that some dwellings within some clusters were 
dropped. These dwellings were marked on the Form 
02s with an ‘S‘ to signal to the interviewer that they 
were part of the dropped sample. 


The stabilization weights were not applied to sub- 
weighted clusters to avoid any increase in the sub- 
weight already present. They were not applied to off- 
rotation clusters since these clusters properly belong 
to a different birth rotation month. 


Effects of Stabilization: As an illustration of the 
savings inherent in the stabilization program, from 
1177 to 0984 over 75,000 dwellings were prevented 
from being interviewed, for a savings of $2.7 million. 


The stabilization program was also used by other 
survey vehicles. The Survey of Consumer Finances 
selected an independent set of households from the 
active set of clusters in the LFS. Stabilization allowed 
complete rotations to be reserved from different areas 
of the LFS frame while still limiting their sample size to 
a fixed total. Another major survey using the LFS frame 
was the Survey of Family Expenditures. The required 
allocations by different cities or city groups could not 
be incorporated in the existing stabilization program 
without major program modifications. 


Redesign Changes: The redesign of the Labour 
Force Survey allowed some basic changes in the 
manner of sample size stabilization. In order to provide 
a more flexible program of stabilization the format for 
defining the base categories was modified to be more 
survey independent. Instead of fixed categories from 
the LFS frame, the stabilization areas were redefined in 
terms of ranges of Primary Sampling Units (PSUs). 
Special surveys such as the Survey of Consumer 
Finances and the Survey of Food/Family Expenditures 
could now also use the standard stabilization proce- 
dures by defining their own PSU ranges. 


Not only the ranges of PSUs but also the basic 
theoretical weights to be applied at the weighting stage 
are now external inputs into the LFS system rather than 
being hard-coded into the various individual pieces of 
software. Thus, the user of the system has direct 
control without complex procedures involved in 
software changes. The formulation of the stabilization 
weights has remained the same. 
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et p_ est la province 
Jj est le secteur de stabilisation 
m est le mois de renouvellement 


Le nombre de logements a retirer de |’échantillon etait 
donc (N-B). Ce nombre était appliqué systematiquement au 
fichier des logements (N-C). Si N était inferieur a B, le secteur 
n’était pas stabilisé ce mois-la. Le résultat de cette operation 
était que certains logements, dans certaines grappes, etaient 
retires. Pour signaler a lintervieweur que ces logement 
faisaient partie des logements retires de l'echantillon, on 
inscrivait un "S" sur la formule 02. 


Les poids de stabilisation n’étaient pas appliques aux 
grappes sous-pondeéreées afin que celles-ci ne soient pas sous- 
pondérées davantage. Ils n’étaient pas appliques non plus aux 
grappes hors-renouvellement puisqu’en realiteé ces grappes 
auraient du étre introduites un autre mois. 


Effets de la stabilisation : Le tableau qui suit montre les 
economies que le programme de stabilisation a permis de 
realiser. Entre 1177 et 6984, 75,000 logements ont ete sous- 
traits a l'interview, ce qui a engendré des economies de $2.7 
millions. 


Le programme de stabilisation etait egalement applique a 
d'autres enquétes. Pour l’enquéte sur les finances des con- 
sommateurs, un ensemble de meénages distinct etait préeleve 
des grappes actives de |’EPA. Le programme de stabilisation 
permettait de réeserver des groupes de renouvellement entiers 
dans différentes parties de la base de sondage de |’EPA tout 
en limitant la taille de l’échantillon a un nombre fixe d’unités. 
La seule autre grande enquéte qui utilise la base de sondage 
de |'EPA est l’enquéte sur les depenses des familles. La 
repartition de l’echantillon entre certaines villes ou certains 
groupes de villes requise par ces enquétes ne pouvait pas 
étre incorporée dans le programme de stabilisation de |’epo- 
que, car cela aurait nécessité de trop grands changements. 


Changements découlant du remaniement : Le rema- 
niement de l’enquéte sur la population active (EPA) a permis 
d’apporter des changements fondamentaux au programme de 
stabilisation de la taille de l’échantillon. Pour rendre ce 
programme plus souple, on a modifié les criteres de definition 
des categories de base afin que celles-ci ne soient pas les 
memes pour toutes les enquétes. Au lieu de répartir la base 
de sondage de |’EPA en catégories fixes, on a redéfini les 
secteurs de stabilisation en termes de tranches d’unites pri- 
maires d’echantillonnage (UPE). Pour les enquétes spéciales 
comme l’enquéte sur les finances des consommateurs et 
l'enquete sur les dépenses alimentaires/les dépenses des 
familles, il est devenu possible de suivre les procédures de 
stabilisation normales tout en définissant des tranches d’'UPE 
qui leur soient propres. 


Autant les tranches d'UPE que les poids théoriques de 
base a appliquer a |’étape de la pondération sont a présent 
des donnees qu’on introduit dans le systeme de |’EPA plutot 
que des elements incorporés aux logiciels. Les utilisateurs du 
systeme peuvent donc prendre des décisions a cet égard qui 
n’entrainent pas des procédures complexes pour modifier les 
logiciels. La formulation des poids de stabilisation n'a pas 
change. 


Development of Base Figures 


Sample Allocation: With the redesigned sample, 
changes to the definitions of base areas for 
stabilization were required. The departure from a self- 
weighting design meant that within a province the 
sample size was summed for major frame types (SR, 
NSR, SPE) with the same basic weight, i.e., with the 
same overall sampling rate. In addition, each Census 
Metropolitan Area (CMA) was given a_ separate 
stabilization area. A minimum rule was applied to the 
resulting breakdown of the sample. Each potential 
stabilization area had to have a minimum of 300 
households in the sample. Any areas with less than 
300 households were designated as unstabilized. All 
unstabilized areas within a province were assigned to 
the same stabilization area. 


The remaining areas were numbered consecu- 
tively to form between two and sixteen areas per 
province. The allocated sample for each area became 
the initial base figure from which the final base figure is 
calculated. Note that CMAs had to have a minimum of 
300 households in their sample for other reasons. 
Thus, each of them is now a separate stabilization 
area. In addition, no Special Area sample is stabilized 
and the Apartment frame is no longer separated from 
the regular SR frame. 


Conversion to Dwellings: The final stage of 
sampling of the LFS is done six weeks prior to 
interviewing and is based on a list of dwellings for each 
selected cluster. Hence, the desired stabilization of 
household sample size must be converted into a base 
figure of dwellings for each stabilization area. 


The major factors in this conversion are as follows: 


Vacancy Rate: The major difference between 
households and dwellings is the set of responses: 
Vacant, Seasonal, Under Construction and Occupied 
By Persons not in the LFS. These comprise 10% to 
15% of the total number of dwellings. 


For each stabilization area (not including unsta- 
bilized areas of course) an estimate of the vacancy rate 
was calculated based on the existing off-line survey 
results for 1084 and 1184. Due to the size of the off- 
line redesign sample, the vacancy rate so calculated 
may be only a crude approximation of the actual rate 
obtained once the redesign implementation Is 
complete. 


Temporary Dockets: Sometimes not all clusters 
are listed in time for sampling. Also additional 
dwellings may be found once the interviewer starts the 
interview process. These late additions are not 
available to the stabilization program. Hence some 
compensation is made on the base figure to allow for 
these extra households after sampling. The additional 
dwellings average about 2.5% of the initial sample 


size. 
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Etablissement des allocations de base 


Répartition de I’échantillon : Une fois le plan de son- 
dage remanie, il a fallu modifier la définition des secteurs de 
base aux fins de la stabilisation. Comme le plan n’était plus 
autopondeére, dans chaque province, on a additionne la taille 
de |’echantillon des principales categories de bases de 
sondage  (secteurs  autorepréesentatifs, secteurs non 
autorepresentatifs et secteurs speciaux) qui avaient le méme 
poids de base, c’est-a-dire la méme fraction de sondage 
globale. On a convenu en outre que chaque région 
meétropolitaine de recensement (RMR) constituait un secteur 
de stabilisation distinct. Il fallait que l’échantillon ainsi ventile 
respecte un critere de taille minimum: |’échantillon de chaque 
secteur de stabilisation eventuel devrait compter au moins 300 
meénages. Les secteurs ou ce nombre n’était pas atteint 
étaient considéres comme des secteurs non stabilisés. Tous 
les secteurs non stabilises d'une province ont ete rattachés au 
meme secteur de stabilisation. 


On a ensuite donne des numéros consécutifs aux sec- 
teurs restants de maniere a former de deux a seize secteurs 
par province. Le nombre d’unites dans |’echantillon attribue a 
chaque secteur est devenu l’allocation de base initiale a partir 
de laquelle l’allocation finale a eté calculée. ll convient de 
noter que les RMR devaient avoir un echantillon d’au moins 
300 menages pour d'autres raisons aussi, de sorte que 
chacune d’elle est devenue d’office un secteur de stabilisation 
distinct. Par ailleurs, l'’échantillon des secteurs spéciaux n’est 
pas stabilisé et la base d’appartements n'est plus separee de 
la base normale des UAR. 


Conversion en nombre de logements : On procede au 
dernier degre d’echantillonnage de |’EPA six semaines avant 
le début des interviews, qui sont faites a partir d’une liste de 
logements dans chaque grappe echantillonnee. Il faut donc 
convertir le nombre de ménages qu'on veut avoir dans 
l'échantillon apres la stabilisation en une allocation de base de 
logements dans chaque secteur de stabilisation. 


Les principaux facteurs qui interviennent dans cette 
conversion sont les suivants : 


Taux de logements vacants : La principale difference 
entre le nombre de menages et le nombre de logements est 
attribuable aux categories "logement vacant", "logement 
saisonnier vacant", "logement en construction” et "logement 
occupé par des personnes ne devant pas étre interviewees”. 
Ces logements representent environ 10 a 11% du nombre 
total de logements. 


Dans chaque secteur de stabilisation (secteurs non stabi- 
lisés exclus, bien sur), la valeur prevue du taux de logements 
vacants est calculée en fonction des résultats obtenus pour 
|'échantillon introduit en paralléle en 1084 et 1184. Compte 
tenu de la taille du nouvel echantillon introduit en parallele, il 
se peut que le taux de logements vacants ainsi calcule ne soit 
qu'une vague approximation du taux obtenu une fois la mise 
en oeuvre du nouveau plan terminee. 


Dossiers temporaires : Il arrive parfois que le listage de 
toutes les grappes ne soit pas fini avant l’echantillonnage, ou 
encore que l'intervieweur déecouvre de nouveaux logements 
apres qu'il ait commence les interviews. Les ajouts que cela 
represente echappent au programme de stabilisation. Il faut 
donc rajuster les allocations de base apres |’éechantillonnage 
pour tenir compte de ces meénages supplementaires. Les 
logements ajoutes constituent en moyenne environ 2.5% de la 
taille initiale de |’echantillon. 


Rotation Imbalance: !|n addition to the conversion 
of households to dwellings, some adjustments were 
made to the base figures for design differences in the 
allocation of sample by rotation. The anticipated 
number of dwellings selected in one rotation is not 
necessarily the same as that selected in other 
rotations. The sample selected each month is almost 
entirely drawn from one rotation. Hence, the base 
figure should reflect these differences. 


The stabilization base figure is allocated to the six 
rotations of the LFS according to the proportion of the 
dwellings assigned to each rotation. Thus, a rotation 
with a larger expected sample take will have a larger 
base figure. Stabilization weights will thus be divided 
proportionally across rotations. It should be noted that 
the differences rarely amount to more than 2% of the 
average base figure. 


Relatively large differences are noted in the NSR 
design since the number of clusters assigned to a 
rotation was relatively small compared with the size of 
the whole stabilization area. Unfortunately, these 
differences do not remain constant since they are 
based on the current set of selected PSUs. As PSUs 
rotate and the balance of sample take by rotation 
changes the stabilization base must also be adjusted. 


Clusters with high yields that are being sub- 
sampled are excluded from the actual stabilizing 
routine but their sample counts are included in 
determining the number of dwellings to drop. Hence, 
some high stabilization weights can be expected in 
areas containing growth situations, especially where 
the total sample size of the area is relatively small 
(close to the 300 household minimum discussed 
earlier). 


Unstabilized Areas: The total sample size for 
Canada was fixed at 51,675 households plus about 
1,300 extra households due to a contract with the 
Alberta Government for a total of 52,975. Only 48,525 
households are allocated to areas covered by the 
Stabilization program. The rest are not stabilized at all 
(4,450 households or 8.5% of the total). 


In effect this means that sample sizes in unsta- 
bilized areas are allowed to grow while stabilized areas 
are maintained relatively constant. Fortunately, 
unstabilized areas are mostly smaller cities with little 
prospect for large growth. Two years after 
implementation the yield in these areas totaled 4,510 
households compared with the 4,450 allocated. 
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Répartition inégale entre les groupes de renouvelle- 
ment : En plus de la conversion du nombre de meénages en 
nombre de logements, il faut aussi rajuster les allocations de 
base pour tenir compte des écarts attribuables au plan de 
sondage observés dans la repartition de |’échantillon entre les 
groupes de renouvellement. Le nombre prévu de logements 
choisis dans un groupe de renouvellement n'est pas 
nécessairement le méme que celui qui est prélevé dans les 
autres groupes de renouvellement. L’echantillon préleve 
chaque mois provient presque entierement d’un groupe de 
renouvellement. L’allocation de base doit donc rendre compte 
des différences attribuables au plan de sondage. 


L’allocation de base aux fins de la stabilisation est repartie 
entre les six groupes de renouvellement de |’'EPA propor- 
tionnellement au nombre de logements attribué a chacun de 
ces groupes. Un groupe de renouvellement dont le rendement 
prévu de |’échantillon est élevé aura par consequent une 
grande allocation de base. Les poids de stabilisation seront 
donc répartis proportionnellement entre les groupes de 
renouvellement. Il convient de noter que les differences 
représentent rarement plus'de 2% de l'allocation de base 
moyenne. 


On a releve d’assez grands écarts dans les secteurs NAR, 
car le nombre de grappes attribué a un groupe de 
renouvellement y était relativement petit comparativement a la 
taille du secteur de stabilisation. Malheureusement, comme 
ces écarts sont liés aux UPE choisies, ils ne demeurent pas 
constants. Des que les UPE sont remplacées et que le reste 
du rendement prévu’ de léchantillon par groupe de 
renouvellement varie, il faut rajuster egalement l’allocation de 
base aux fins de la stabilisation. 


Les grappes qui ont un rendement de |’echantillon élevé 
et qui sont sous-echantillonnées ne sont pas a proprement 
parler soumises au programme de stabilisation, mais on tient 
compte de la taille de leur eéchantillon au moment de 
determiner le nombre de logements a laisser tomber. On peut 
donc s’attendre que certains poids de stabilisation soient 
eleves dans les secteurs ou il y a des situations de 
croissance, particulierement si la taille de l’échantillon global 
du secteur est relativement petite (pres du minimum de 300 
menages mentionne plus haut). 


Secteurs non stabilisés : L’échantillon pour l'ensemble 
du Canada avait été fixe a 51,675 ménages, plus environ 
1,300 logements supplementaires rajoutés en raison d’une 
entente conclue avec |’Alberta, ce qui en portait la taille totale 
a 52,975 ménages. Dans les faits, 48,525 ménages seulement 
sont attribues a des secteurs visés par le programme de 
stabilisation. Les autres en sont completement exclus (4,450 
meénages, ou 8.5% de |’échantillon total). 


Cette situation signifie qu’on permet a la taille des échan- 
tillons dans les secteurs non stabilisés d’augmenter tandis 
qu'on maintient a un niveau relativement constant la taille des 
echantillons dans les secteurs stabilisés pour contrebalancer 
la croissance de _ |’échantillon global. lleseumirouve 
qu'heureusement les secteurs non stabilisés sont pour la 
plupart de petites villes qui ont peu de chances de voir leur 
population augmenter. Deux ans aprés la mise en oeuvre du 
programme de stabilisation, le rendement de |’échantillon y 
etait de 4,510 ménages, alors qu'on leur en avait attribué 
4,550. 


Implementation 


| Phase Out of Old Design: Due to the introduc- 
tion scheme of the redesign the last three months of 
the old design involved a much reduced sample. 
Hence, the stabilization base figures for 1084 to 1284 
inclusive had to be modified accordingly. Many areas 
that were completely on-line had no old sample in 
these months. Other areas had such small residual 
base figures that they were left unstabilized. 


Phase In of New Design: During the first three 
months, from 1084 to 1284, the redesign sample was 
not stabilized at all. The implementation of the revised 
Stabilization program started at 0185. As such, the full 
effect of stabilization was not felt until the June survey 
(0685), when all the rotations had gone through the 
new stabilization routines at sampling. 


Results: The following tables are included to 
summarize the results of the above discussions. The 
final sample size in June of 1985 was 52,563 
households compared with the allocation of 52,975, 
which indicates the imprecision inherent in trying to 
stabilize household size through the sampling routine 
six weeks prior to interviewing. 
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Mise en oeuvre du programme de stabilisation 


Abandon de I’ancien plan : Compte tenu du mode 
d'introduction du nouveau plan de sondage, |’échantillon 
utilise pendant les trois derniers mois ou l’on se servait de 
l’‘ancien plan a été réduit de beaucoup. II a donc fallu modifier 
en consequence les allocations de base pour les mois 1084 a 
1284 inclusivement. Dans de nombreuses regions ou 
l’echantillon était entierement introduit progressivement, 
aucune partie de |’échantillon n’a ete prelevee selon l’ancien 
plan pendant cette période. Dans d'autres régions, les 
allocations de base résiduelles étaient si faibles que celles-c! 
nont pas ete soumises a la stabilisation. 


Introduction du nouvel échantillon : Pendant les trois 
premiers mois, soit de 1084 a 1284, |’echantillon preleve selon 
le nouveau plan de sondage n’a pas ete stabilise du tout. La 
mise en oeuvre du nouveau programme de stabilisation a 
commence au mois 0185. L'effet complet de la stabilisation ne 
s'est donc pas fait sentir avant l'enquéte de juin (0685), apres 
que tous les groupes de renouvellements aient ete soumis au 
nouveau. programme de_ stabilisation au moment de 
l’echantillonnage. 


Résultats - Les tableaux qui suivent resument l’expose 
que nous venons de faire. La taille finale de |’eéchantillon en 
juin 1985 etait de 52,563 meénages, comparativement au 
nombre de 52,975 attribue, ce qui montre le manque de 
precision qui résulte de la stabilisation de l’echantillon des 
ménages au moment de |’echantillonnage, six semaines avant 
le debut des interviews. 


Table B-1: Actual Sample Sizes for October 1984 


to June 1985 
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Tableau B-1: Taille réelle des échantillons d’octobre 


1984 a juin 1985 


Old Design New Design New Design Grand 
Total On-Line Off-Line Total 
Month Total selon Echant. introd. Echant. introd. Total 
ancien plan progressiv./ en parallele/ 
Mois Nouveau plan Nouveau plan 
Dwg Hhd Dwg Hhd Dwg Hhd Dwg Hhd 
Logements Menages Logements Menages Logements Menages Logements Ménages 
1084 56484 50121 5920 5432 12799 11248 75203 66801 
1184 50272 44390 alae 10833 17027 15048 79056 70271 
1284 44140 38588 17501 16228 21178 18758 82819 73574 
0185 12114 11030 48452 43770 60566 54800 
0285 6107 5547 53934 48855 ' 60041 54402 
0385 59355 53883 BESS 53883 
0485 58964 SS oie: 58964 93372 
0585 58563 52945 58563 52945 
0685 58244 52563 58244 52563 
Table B-2: Stabilization Base Figures by Area Tableau B-2: Allocations de base aux fins de la 
Used for 0185 Survey stabilisation pour l’enquéte du mois 0185, 
Area Province 
Secteur 0 1 2 S 4 5 6 7 8 9 
1 54 TES Wit 138 non non 324 216 185 81 
2 non 161 non 120 60 13) 58 58 non 100 
S 260 184 112 103 452 non 165 94 non 
4 112 118 266 109 51 57 318 269 302 
5 240 69 344 66 2 1S 292 90 
6 non 52 109 157 non 100 SS 
7 55 102 251 125 
8 54 97 115 63 
9 97 56 64 
10 106 54 
1 303 58 
12 62 
13 62 
Ls 293 
15 94 
16 
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Table B-3: Identification of Stabilization Areas by 


Province Tableau B-3: Identification des secteurs de stabilisation, 


par province 


Area Area 
Province Browhee 
Secteur Secteur 
Newfoundland - Terre-Neuve La Baie 3 
Saint-Hyacinthe 3S 
aes T. 1 Salaberry-De-Valleyfield 3 
Happy Valley, T-Goose Bay : —— : 
Labrador, C-Wabush 1 St-Jean 3 
Stephenville, T. 1 St-Jérome 3 
Wabana-Bell Island 1 Thetford Mines 3 
Windsor, T-Grand Falls 1 Victoriaville 3 
NSR-ERO20 -—- NAR-REO20 2 Ville de Québec a 
SPECIAL AREAS -— SECTEURS SPECIAUX 2 NSR-ER411 NAR-RE411 10 
eee = oe 4 ei -~ NAR-RE412 1 
j = 3 4 NSR-ER420 - NAR-RE420 11 
NSR-ERO40 - NAR-REO40 4 NSR-ER430 - NAR-RE430 11 
Channel-Port Aux Basques 2 NSR-ER440 - NAR-RE440 1 
Corner Brook, C. 2 NSR-ER450 - NAR-RE450 ib 
Fortune, T-Grand Bank 2 NSR-ER461 - NAR-RE461 11 
ORs ill ce) 2 NSR-ER463 - NAR-RE463 11 
. John’s - Saint-Jean 3 NSR-ER464 - NAR-RE464 10 
’ : : NSR-ER470 - NAR-RE470 11 
Prince Edward Island —- lle-du-Prince-Edouard NSR-ER480 NAR-RE480 10 
SPECIAL AREAS - SECTEURS SPECIAUX 1 
ec 1 Montreal PSU 46100-46219 — UPE 46100-46219 5 
ummerside 1 Hull 6 
NSR-ER100 - NAR-RE100 2 Chicoutimi-Jonquieére VE 
j Trois Rivieres 8 
Nova Scotia - Nouvelle-Ecosse Montreal PSU 46220-46254 -— UPE 46220-46254 9 
Sydney Mines 1 Ontario 
Sydney-Glace Bay 1 
Bridgewater 2 Belleville- Trenton 1 
Kentville 2 Brantford 1 
Kingston-Greenwood 2 Cornwall 1 
Liverpool 2 Kenora-Keewatin 1 
New Glasgow 2 ee 1 
Truro 2 arnia 1 
Yarmouth 2 Guelph 2 
SPECIAL AREAS - SECTEURS SPECIAUX 2 Peterborough 2 
NSR-ER210 - NAR-RE210 4 Sault Ste. Marie 2 
NSR-ER220 - NAR-RE220 4 Toronto 3 
NSR-ER250 -— NAR-RE250 4 Oshawa 4 
NSR-ER230 - NAR-RE230 5 Barrie 5 
NSR-ER240 - NAR-RE240 5 Chatham 5 
Halifax 3 Fort Erie 5 
Halton Hills 5 
New Brunswick -— Nouveau-Brunswick Milton . 5 
Newcastle 5 
Barthust1 1 St. Thomas 5 
Chatham/Newcastle es Me: : 
m n 
oop | RSRERSNE ~ NAB RES%S ; 
1 -ER510 - -RE51 14 
Goer als 2 NSR-ER520 — NAR-RE520 15 
Dalhousie-Campbellton 
Moncton 2 NSR-ER530 - NAR-RE530 14 
Oromoato 2 NSR-ERS540 - NAR-RE540 14 
Saint John 3 NSR-ERS5SO - NAR-RESSO 14 
NSR-ER310 - NAR-RE310 4 NSR-ERS560 - NAR-RES60 14 
NSR-ER320 - NAR-RE320 4 NSR-ER570 — NAR-RE570 14 
NSR-ER330 - NAR-RE330 4 NSR-ER580 - NAR-RE580 16 
Baer asaGe a AR-HEDSD : NSR.ERSO2 — NAR-RESO? is 
0 S f E : L 
Bee nen oh SEC TEURS SPECIAUX 6 eae pet oe AREAS - SECTEURS SPECIAUX 2 
iot Lake 
Kirkland Lake 6 
Quebec 
North Bay 6 
Baie-Comeau L ae eae Z 
Gaspé 1 tratfor 
Rimouski A tt i 
1 awa 
ik 1 Lane ae : 
; 1 under Bay 
Val D'Or 2 Windsor 10 
Sherbrooke 5 Kitchener-Waterloo 1 
Alma 3 St. Catharines-Niagara 12 
ee li 3 London 13 
3 


Joliette 


Table B-3: Identification of Stabilization Areas by 


Province — Concluded 
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Tableau B-3: Identification des secteurs de stabilisation, 
par province -— fin 


Area Area 
Province 
Province Ream pedterieys 
Manitoba Saskatchewan 
Winnipeg 1 Battleford 1 
NSR-ER610 — NAR-RE610 4 Estevan 1 
NSR-ER620 - NAR-RE620 5 Lloydminster 1 
NSR-ER630 —- NAR-RE630 6 Melfort 1 
NSR-ER640 - NAR-RE640 5 Melville 1 
NSR-ER650 —- NAR-RE650 6 Moose Jaw 1 
NSR-ER660 NAR-RE660 6 North Battleford 1 
SPECIAL AREAS — SECTEURS SPECIAUX 3 Prince Albert 1 
Brandon 2 Swift Current 1 
Dauphin 2 Wayburn 1 
Flin Flon/The Pas 2 Yorkton 1 
Thompson 2 NSR-ER710 - NAR-RE710 4 
Portage La Prairie 3 NSR-ER720 - NAR-RE720 4 
Selkirk 3 NSR-ER730 -— NAR-RE730 4 
NSR-ER740 - NAR-RE740 5 
NSR-ER750 -— NAR-®E750 4 
SPECIAL AREAS - SECTEURS SPECIAUX 6 
Regina 2 
Saskatoon 3 
Alberta British Columbia - Colombie-Britannique 
Lethbridge 1 Cranbrook 1 
Medicine Hat 1 Dawson Creek/Ft. St. John 1 
Red Deer 1 Kimberley 1 
NSR-ER810 NAR-RE810 6 Kitimat/T errace 1 
NSR-ER820 NAR-RE820 i; Prince Rupert 1 
NSR-ER830 NAR-RE830 6 Kelowna 2 
NSR-ER840 NAR-RE840 7 Mission/Matsqui 2 
NSR-ER850 NAR-RE850 8 Penticton 2 
NSR-ER860 NAR-RE860 6 Port Alberni 2 
NSR-ER870 NAR-RE870 9 Powell River 2 
NSR-ER880 NAR-RE880 8 Trail/Rossland 2 
SPECIAL AREAS — SECTEURS SPECIAUX 2 Vernon 2 
Drumheller 2 Chilliwack 3 
Lloyminster 2 Kamloops 3 
Fort McMurray S) Nanaimo 3 
Grande Prairie 3 Prince George 3 
Calgary 4 Vancouver 4 
Edmonton 5 Victoria 5 
NSR-ER910 NAR-RE910 3 
NSR-ER920 NAR-RE920 6 
NSR-ER930 NAR-RE930 i 
NSR-ER940 NAR-RE940 6 
NSR-ER950 NAR-RE950 lh 
NSR-ER960 NAR-RE960 i 
NSR-ER970 NAR-RE970 8 
NSR-ER980 NAR-RE980 8 
SPECIAL AREAS - SECTEURS SPECIAUX 3 


Future Implications 


Regular Monitoring: Due to the sample related 
nature of estimating the stabilization base figures, a 
regular program of monitoring has been established to 
examine the validity of the assumed vacancy rate. 
Adjustments may be made every six months in order 
to keep the sample size consistently close to the 


desired number of households. 


Since the stabilization areas are defined by 
province, any major changes in the sample sizes would 
affect the allocation of resources to those Regional 
Offices that split a province. A regular program of 
monitoring will spread these changes over many years 
as well as provide the capacity to report on current 


sample sizes by the Regional Offices. 


Conséquences pour l’avenir 


Contrdle régulier : Comme |’estimation des allocations 
de base aux fins de la stabilisation est étroitement li¢e a la 
taille de l’echantillon, un programme régulier de contrdle a 
eté mis sur pied dont le but est d’examiner la validité du taux 
presumé de logements vacants. Des rajustements peuvent 
étre faits tous les six mois dans le but de faire en sorte que la 
taille de l’echantillon se maintienne aux alentours de 52,975 
ménages. 


Les secteurs de stabilisation étant définis par province, 
tout changement important dans la taille des échantillons 
aurait une incidence sur l’attribution des ressources aux 
bureaux regionaux qui se partagent une province. Un 
programme regulier de contrdle aura pour effet d’étaler ces 
changements sur plusieurs années et permettra aussi de faire 
connaitre la taille actuelle des échantillons par bureau 
regional. 


Reallocation of Sample: It is reasonable to 
suppose that under certain conditions a reallocation of 
sample may occur during the life of the current design. 
The current sampling system can easily handle a 
change in the definition of the sample universe or in a 
simple reallocation of the available sample. 


Possible scenarios include a reduction in the 
sample due to budgetary restraints. In this case the 
theoretical weight is increased for certain areas while 
the base figures are decreased correspondingly. In 
June 1986 an overall 10% sample size reduction was 
implemented. As the following table shows, the 
reduction was concentrated in major cities where the 
reliability of the sample was high. 


Table B-4: Sample Reduction (June 1986) 
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Nouvelle repartition de l’echantillon : |i est raisonnable 
de supposer que, dans certaines conditions, on aura a 
proceder a une nouvelle répartition de |’échantillon pendant la 
période ou le plan de sondage actuel sera en application. La 
methode d’échantillonnage peut facilement se préter a un 
changement de la définition de l’univers de |’échantillon ou a 
une simple nouvelle repartition de |’échantillon. 


La reduction de l’échantillon en raison de contraintes 
budgetaires est une des éventualites. Si elle se présente, on 
augmente le poids théorique pour certains secteurs et on 
diminue les allocations de base en consequence. En juin 
1986, la taille globale de l’échantillon a ete réduite de 10%. 
Comme le tableau qui suit le montre, cette réduction a ete 
effectué€e principalement dans les grandes villes ou le degre 
de fiabilité de |’échantillon était éleve. 


Tableau B-4: Réduction de I’échantillon (juin 1986) 


Allocation Percent Sample 
City Household Reduction Reduction 
Ville Nombre de Réduction Nombre de 


ménages attribues 


en pourcentage menages soustraits 


St. John's 637 25.00% 161 
Sydney 322 20.00% 64 
Halifax 1043 25.00% 261 
Moncton 536 25.00% 134 
Saint John - Saint-Jean 620 25.00% 155 
Fredericton 348 20.00% 68 
Quebec - Québec 609 10.00% 62 
Montreal — Montreal 2499 33.33% 833 
Hull 301 25.00% eS 
Ottawa 589 25.00% 148 
Toronto 2599 33.33% 866 
Hamilton 560 10.00% 56 
Winnipeg 1853 25.00% 463 
Regina 962 25.00% 238 
Moose Jaw 287 20.00% 56 
Saskatoon 938 25.00% Zoe 
Calgary 1484 23.00% 339 
Edmonton 1631 23.00% 372 
Vancouver 1704 : 33.33% 569 
Victoria 554 10.00% 56 
New Areas Nouveaux secteurs 


At the moment the unstabilized areas do not 
present a problem for determining stabilization base 
figures for the other areas. If the sample becomes 
excessive in these areas there is the option of taking 
some of the PSU ranges currently unstabilized and 
creating a new area category. In effect this change 
implies a reduction in the minimum household size 
used as a Criterion for assigning a separate stabilization 
area. 


If the minimum household size for a stabilized area 
were lowered from 300 to 200, then about 1,790 extra 
households would enter the domain of stabilization. 
The inclusion of these areas in the stabilization would 
reduce the unstabilized allocations from 8.5% to 5.0% 
of the total sample size. 


Actuellement, les secteurs non stabilises ne posent pas 
de probleme en ce qui a trait a la determination des 
allocations de base pour les autres secteurs aux fins de la 
stabilisation. Si l’échantillon devenait trop grand dans ces 
secteurs, il serait toujours possible de prendre certaines 
tranches d'UPE dans les secteurs non stabilises et de creer 
une nouvelle categorie de secteur. Cela reviendrait a faire 
baisser le nombre minimum de ménages qui sert de critere a 
la création d'un secteur de stabilisation. 


Si on faisait passer le nombre minimum de meénages de 
300 a 200, il y aurait environ 1,790 menages de plus dans le 
programme de stabilisation. Le proportion de menages non 
visés par le programme par rapport a l’échantillon global 
passerait alors de 8.5 a 5.0%. 
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The danger of including these new areas is that a ll y aurait un danger a inclure ces nouveaux secteurs dans 
large increase in sample size due to a growth cluster, le programme de_ stabilisation, et c’est qu'une forte 
for example, will produce a large stabilization weight to augmentation de la taille de lechantillon, attribuable, par 
compensate. Instead of the stabilization program exemple, a la croissance de la population dans une grappe, 
having a minor stabilizing effect the high weight would aurait pour résultat un poids de stabilisation eleve qu'il faudrait 


contrebalancer. Au lieu que le programme ait un effet de 
stabilisation faible, le poids élevé augmenterait la variabilité 
des données. 


increase the variability of the data. 


Appendix C 


Sample Phase-In 


At the time of the preceding redesign, when the 
sample based on the 1971 Census was introduced, 
extensive tests were conducted through 1973 and 1974 
to accommodate the major revisions to the survey. 
These tests culminated in a parallel run through all of 
1975. The parallel run was a full parallel survey which 
used the then new sample and incorporated the 
revisions and innovations that had been developed. 
The phasing in of that sample was done gradually from 
0574 through 1274, although the full sample expansion 
extended into 1976. 


For the Labour Force Survey sample redesign 
introduction following the 1981 Census the prevailing 
consideration was timeliness, limited by quality 
assurance and cost implications. The requirement of a 
gradual introduction of the new sample extending over 
three or more months was respected by phasing in the 
new sample in steps from 1084 through 0385. 


The requirement for a gradual phase-in of a new 
sample is dictated by three main factors: 


(i) Rotation Group bias 


The LFS sample consists of six equal panels 
identified by rotation numbers 1 to 6. Normally on 
any survey occasion, one panel is in the survey for 
the first occasion, another for the second, and so 
forth. For major labour force characteristics such 
as "unemployed" and "employed", there tends to 
be a small systematic difference among panels - a 
phenomenon known as_ rotation group bias. 
Unemployment rates are higher in the first month, 
for example, than in later months. It takes six 
months to introduce an LFS sample so that all of 
its panels are properly aged. 


If the sample were introduced in less than six 
months, the expected value of survey estimates 
would differ initially from those of a properly aged 
sample. However, under the levels of rotation 
group bias observed in the old survey, the time 
period required to achieve an adequate 
approximation of a properly aged sample can be 
shortened to three or four months. During this time 
the new sample should not be used for deriving 
official estimates. The difference in estimates 
between panels of successive months decreases 
exponentially as the panel ages. By the third 
month a near stable picture appears. 


Annexe C 


Introduction de l’echantillon 


Apres le remaniement de |’avant dernier plan de sondage 
et l'introduction de l’échantillon basé sur le recensement de 
1971, en 1973 et 1974, on a réalisé des essais tres pousses 
pour verifier l'effet des grands changements apportes a |’en- 
quéte, et ces essais ont abouti a la tenue d'un essai paralléle 
pendant toute l'année 1975. Ce qu’on a appelé l'essai 
parallele etait dans les faits une enquéte a part entiére aupres 
de ce qui etait a l’epoque le nouvel échantillon et dans 
laquelle on avait incorporeé toutes les révisions et innovations 
effectuees. L'introduction de cet échantillon s'est faite pro- 
gressivement entre le mois 0574 et le mois 1274, mais ce 
n'est qu’en 1976 que |’échantillon elargi a ete entierement en 
place. 


Lorsqu’on a commence le remaniement de |’enquéte sur 
la population active apres le recensement de 1981, le principal 
souci etait |’actualite des données, qu’on ne devait chercher a 
obtenir ni aux depens de la qualite des donnees ni a n’importe 
quel cout. Il fallait aussi que le nouvel echantillon soit introduit 
graduellement sur une période de trois mois ou plus, ce qui a 
ete fait en procédant par étape du mois 1084 au mois 0385. 


C’est pour tenir compte de trois facteurs qu'on doit 
introduire un nouvel echantillon graduellement : 


(i) Biais de renouvellement 


L’échantillon de EPA est constitué de six panels de taille 
egale portant les numeros de renouvellement 1 a 6. 
Normalement, chaque fois que |’enquéte a lieu, il y a un 
des panels qui participe a l’enquéte pour la premiere fois, 
un autre, pour la deuxieme, et ainsi de suite. Pour les 
principales caracteristiques de la population active, 
comme le fait d’étre en chomage ou d’avoir un emploi, la 
valeur prévue varie selon le panel. C’est ce qu'on appelle 
le biais de renouvellement. Les taux de chomages sont 
plus éleves le premier mois, par exemple, que pendant 
les derniers mois. Il faut compter six mois pour introduire 
un echantillon de EPA de maniere a ce que tous les 
panels aient l’anciennete ideale. 


Si on introduisait |’échantillon en moins de six mois, la 
valeur préevue des estimations de !l'enquéte serait 
differente au depart de celle qu'on obtiendrait si 
l'echantillon avait la bonne composition du point de vue 
de l’ancienneteé. Cependant, compte tenu du biais de 
renouvellement observe selon l’ancien plan, il serait 
possible de réeduire a trois ou quatre mois la periode 
necessaire pour se rapprocher des resultats obtenus avec 
un echantillon ayant le profil d’anciennete ideale, mais il 
ne faudrait pas se baser sur les données recueillies 
aupres du nouvel echantillon pour calculer les estimations 
officielles. L’ecart entre les estimations obtenues pour les 
différents panels pendant des mois consécutifs diminue 
de facon exponentielle au fur et a mesure que 
l'echantillon se rapproche du profil d’anciennete ideal. 
Dés le troisieme mois, la situation se stabilise. 


(ii) New Interviewer Effect 


(iii) 


A consequence of the new sample being selected 
independently of the old was a requirement to hire 
new interviewers in Non Self-Representing Areas 
wherever the location of the sample changed. Past 
studies have shown that the work of new 
interviewers differs from that of experienced inter- 
viewers in initial months, although comparability of 
work is achieved after approximately three months. 
The differences relate both to operational 
measures, such as non response and edit failure 
rates, and to labour force characteristics. Hence, 
wherever a sizable proportion of new interviewers 
is required, the redesigned sample should not be 
used for official estimates until after a period of 
stabilization. 


Field Capacity 


When they are first introduced to the sample, 
dwellings require more time to interview; hence 
data quality related aspects (i) and (il) aside, 
interviewers could not cope with introducing an 
entirely new sample in a single month. Rather, this 
work has to be spread over several months. 


Three alternative phase-in strategies considered 


were as follows: 


Strategy 1: On-line implementation 


Under this strategy, the new sample would be 


introduced month-by-month by simply replacing the 
dwellings from the existing design with new ones from 
the redesign in the appropriate rotation. Operational 
considerations, namely the pace at which the work was 
proceeding, dictated that the earliest month in which 
such a phase-in could begin was October 1984. The 
pattern of interviewing by rotation is given below. 


Rotation Number 
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(ii) Effet de l'inexpérience des nouveaux intervieweurs 


Lorsque le nouvel échantillon est prélevé de facon 
indépendante par rapport a |’ancien, il faut embaucher de 
nouveaux intervieweurs dans les secteurs non autorepre- 
sentatifs partout ou l’emplacement des unites echantil- 
lonnées n’est plus le méme. Des études réalisees par le 
passé ont montré que, pendant les premiers mois de 
l'enquéte, il y a des differences entre le travail accompli 
par les nouveaux intervieweurs et le travail accompli par 
les intervieweurs ayant de l’experience, mais qu’au bout 
de trois mois les résultats sont comparables. Les diffé- 
rences observées se situent aussi bien sur le plan opera- 
tionnel (taux de non réponse et rejets a la verification) que 
sur le plan des caractéristiques de la population active. 
Par conséquent, lorsqu’il est nécessaire d’embaucher une 
proportion importante de nouveaux intervieweurs, il ne 
faut pas diffuser d’estimations officielles calculees d’apres 
les données recueillies auprées de |’échantillon préleve 
selon le nouveau plan de sondage tant qu'une période de 
stabilisation ne s'est pas écoulée. 


(iii) Possibilites du personnel sur le terrain 


Lorsque les ménages participent a l’enquéte pour la pre- 
miére fois, il faut prévoir plus de temps pour linterview. 
Par conséquent, méme si l'on faisait abstraction des 
facteurs (i) et (il), les intervieweurs ne seraient pas en 
mesure de faire en un mois les interviews aupres d'un 
échantillon entierement compose de nouveaux menages. 
ll faut que ce travail soit étalé sur plusieurs mois. 


Trois strategies pour l’introduction du nouvel echantillon 
ont été examinées : 


Stratégie 1 : Introduction progressive 


Selon cette strategie, le nouvel échantillon serait introduit 
un mois a la fois en remplacant simplement les logements 
préleves selon l’ancien plan par des logements prélevés selon 
le nouveau plan en respectant les numéros de. re- 
nouvellement. Compte tenu de critéres d’ordre opérationnel, 
plus precisément la vitesse a laquelle le travail avancait, il a 
été convenu que l’introduction progressive ne pouvait pas 
commencer avant le mois d’octobre 1984. Le mode de 
fonctionnement serait le suivant : 


Numéro de renouvellement 


Date 


New Sample Old Sample 


Nouvel échantillon Ancien echantillon 


October 1984 - Octobre 1984 
November 1984 - Novembre 1984 
December 1984 - Déecembre 1984 
January 1985 -— Janvier 1985 
February - Fevrier 1985 

March — Mars 1985 


During this period, official estimates would be 
based on weighted averages of the separate estimates 
for the old and new sample, e.g.. 


Oct. 84 official estimate 
= 5/6 estimate from old sample 
+ 1/6 estimate from new sample. 


Strategy 2: Off-line implementation 


In this strategy, the new sample would be allowed 
to build up in parallel with the existing sample. During 
this time period official estimates would be based 
entirely on the old sample. Once the new sample had 
been adequately aged to prevent rotation group bias 
and new interviewer effects, the old sample would be 
dropped and the new sample would continue. This 
strategy is represented below: 


Rotation Number 
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Pendant cette période, les estimations officielles seraient 
basees sur des moyennes pondérées des estimations se 
rapportant a l’ancien et au nouvel échantillons. Par exemple : 


Estimations officielles pour oct. 84 
= 5/6 des estimations d’apres |’ancien plan 
+ 1/6 des estimations selon le nouveau plan. 


Strategie 2 : Introduction en parallele 


Selon cette strategie, le nombre de ménages du nouvel 
echantillon interrogés augmenterait alors que, parallélement, 
l'enquéte se poursuivrait auprés de |l’ancien échantillon. Pen- 
dant ce temps, les estimations officielles seraient entierement 
fondées sur les données recueillies auprés de l’ancien 
echantillon. Une fois que le nouvel échantillon aurait un profil 
d’ancienneté suffisamment bon pour qu'on n’ait a craindre ni 
le biais de renouvellement ni |l’effet de l'inexperience des 
nouveaux intervieweurs, on abandonnerait l’ancien échantillon 
et on poursuivrait avec le nouveau. Cette strategie serait 
representee de la maniere suivante : 


Numero de renouvellement 


Date 


New Sample 


Nouvel echantillon 


Old Sample 


Ancien echantillon 


September 1984 - Septembre 1984 
October 1984 - Octobre 1984 
November 1984 -— Novembre 1984 
December 1984 -— Decembre 1984 
January 1985 - Janvier 1985 


1 oOonPrw 


“Sample not used for official estimates. —- 


Strategy 3: Combined Strategy 


Under this strategy all areas would be designated 
as either on-line or off-line. The on-line method as 
described would be used in those provinces where 
Economic Region boundaries had not changed 
between 1971 and 1981 and where most of the old 
interviewers could be retained for the new sample. 


In those provinces where Economic Region boun- 
daries had changed or where a significant number of 
new interviewers was anticipated, the introduction 
would be off- line according to the schedule as shown 
for strategy 2. To further minimize the amount of off- 
line sample in these provinces, core portions of SR 
areas unaffected by boundary changes would also be 
introduced on-line. 


Figure C-1 describes the composition of the 
Labour Force Survey sample by rotation group each 
month during the phase-in period for the two different 
types of areas. 


Echantillon sur leque/ on ne baserait pas les estimations officielles 


Strategie 3 : Strategie mixte 


Selon cette strategie, les secteurs seraient repartis en 
deux catégories: ceux ou l'introduction de |’echantillon se 
ferait progressivement et ceux ou elle se ferait en paraliele. La 
methode d’introduction progressive de |’echantillon decrite 
plus haut serait utiliseée dans les provinces ou les limites des 
régions economiques n'ont pas change entre 1971 et 1981 et 
ou l'on pourrait garder la plupart des anciens intervieweurs 
pour le nouvel éechantillon. 


Dans les provinces ou les limites des regions e€conomi- 
ques ont changé ou ou I’on prévoit qu'il faudra embaucher un 
grand nombre de nouveaux intervieweurs, |’introduction se 
ferait en paralléle selon le calendrier presente pour illustrer la 
strategie 2. Pour reduire encore davantage la taille de 
l'echantillon introduit en parallele dans ces provinces, 
l'echantillon serait introduit progressivement dans les parties 
centrales des secteurs AR qui n'ont pas ete touchees par les 
changements de limites. 


La figure C-1 décrit la composition de |’echantillon de 
l'enquéte sur la population active par groupe de renou- 
vellement a chaque mois de la periode d’introduction selon les 
deux categories de secteurs. 


Figure C-1 


Composition of Sample by Rotation Group 
Under the Combined Strategy 
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Figure C-1 


Composition de l’echantillon par groupe de 
renouvellement selon la strategie mixte 


Rotation Dec. Jan. Feb. March 
Sept. Oct. Nov. 
Gr. de Dec. Jan. Fev. Mars 
renouv. 
1 O O O O N N N 
2 O O O O O N N 
3 O O O O O O N 
On-line areas - Secteurs 4 O N N N N N N 
d'introduction progressive 5 O O N N N N N 
6 O O O N N N N 
1 O O O O N N N 
2 O Oa Oa Oa N N N 
é O Oa Oa Oa N N N 
Off-lines areas - Secteurs 4 O Oa Oa Oa N N N 
d'introduction en paralléle 5 O O Oa Oa N N N 
6 O O O Oa 4 N N N 


O 
N 
a 


= old sample 
new sample for official estimates purposes 
= advanced new sample (not used for official estimates) 


— A = ancien echantilion 


Rationale for choice of Phase-in Strategy 


The phase-in strategy adopted was number 3, the 


combined strategy. This section traces the rationale 
leading to its choice by examining the strengths and 
weaknesses of the on- line and off-line strategies. 


On-line Strategy: 


Advantages 


(i) 


(ii) 


It retains the normal panel structure of the LFS 
sample, so that there are no problems with rotation 
group bias. 


Its cost is minimal. Since the old sample is 
dropped rotation by rotation as the new sample is 
introduced, there is no doubling of new and old 
samples. 


Disadvantages 


(i) 


Subprovincial Estimation in the Face of Boundary 
Changes 


Problems arise for subprovincial areas, such as 
Economic Regions or CMAs whose boundaries 
have changed, since estimates for either old or 
new boundaries could not be produced from either 
sample by using standard estimation techniques. 


— N = nouvel échantillon. servant aux estimations Officielles. 
— n = nouvel échantillon avance (ne servant pas aux estimations officielles) 


Raisons expliquant le choix de strategie 


La stratégie adoptée pour l’introduction de |’échantillon 
est la stratégie 3, soit la strategie mixte. Dans cette section, 
nous allons examiner les raisons qui ont amene les respon- 
sables de |l’enquéte a la choisir en nous penchant tour a tour 
sur les avantages et les inconveénients de la strategie d’intro- 
duction progressive et de la strategie d’introduction en 
parallele. 


Stratégie d’introduction progressive 
Avantages 


(i) Elle respecte la structure normale des panels de 
l'echantillon, de sorte qu’il n’y a pas de probleme de biais 
de renouvellement. 


(ii) Son cout est minime. Comme on laisse tomber l’ancien 
echantillon groupe de renouvellement par groupe de 
renouvellement, au fur et a mesure que le nouvel 
éechantillon est introduit, on n’utilise jamais l’ancien et le 
nouvel échantillons en méme temps. 


Inconvenients 
(i) Estimations infraprovinciales la ou les limites on changé 


On se heurte a des difficultes dans les régions infra- 
provinciales comme les régions economiques et les RMR 
ou les limites ont changé, car il n'est possible de produire 
des estimations ni selon les anciennes limites si selon les 
nouvelles en se basant sur l'un ou l'autre des échantillons 
au moyen des techniques d’estimation normales. 


(ii) Lack of Stabilization Period for New Interviewers 


In the NSR portion of some provinces, it was 
anticipated that a high proportion of new 
interviewers would be required. Under the on-line 
Strategy, the use of new sample for estimation 
purposes from the outset would create the 
possibility of a significant new interviewer effect on 
the relevant estimates. 


(ii 


aos 


Small Initial Assignments for Interviewers 


Where new interviewers are required, _ initial 
assignment sizes might cause turnover. 


There were no satisfactory solutions to the first two 
disadvantages, the most important ones. 


Off-line Strategy 


The off-line strategy overcomes the three pro- 
blems associated with the on-line strategy. Moreover, 
rotation group bias from estimates based on a correctly 
aged sample would be neglible. In contrast, there are 
drawbacks in terms of cost and burden on field staff 
when old interviewers are retained for the new sample, 
since there is no lessening of work related to the old 
sample. 


Advantages 
(i) New Interviewer Effect 


The new sample builds up for three months before 
it is used. This is deemed a sufficient break-in 
period for new interviewers. 


(ii) New Interviewer Workloads 


New interviewers are started with three-sixths of a 
full assignment comprising only first, hence longer, 
interviews. Second and third month interviewers 
receive four-sixths and five-sixths of a normal 
assignment. 


(ili) Impact of Rotation Group Bias 


Calculations by Ghangurde (1982) show that 
rotation group biases from a correctly aged 
sample are small enough not to cause pro- 
blems. 


Disadvantages 


(i) Old interviewers retained for the new sample are 
required for both samples during the phase-in 
period, feasible only if survey weeks in off-line 
areas are different. 
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(ii) Pas de période de stabilisation pour les nouveaux 
intervieweurs 


ll etait prévu qu’on aurait besoin d’une grande proportion 
de nouveaux intervieweurs dans la partie NAR de cer- 
taines provinces. Lorsqu’on applique la stratégie d’intro- 
duction progressive, si on se fonde dés le départ sur les 
données recueillies aupres du nouvel échantillon pour 
produire les estimations, |l’effet de l'inexpeérience des nou- 
veaux intervieweurs risque d’entacher fortement ces 
derniéres. 


(ii 


a 


Petites taches initiales pour les intervieweurs 


Lorsqu’il faut embaucher de nouveaux intervieweurs, si la 
tache initiale est trop grande, le roulement de personnel 
risque d’étre éleve. 


On n’a pas trouve de solution satisfaisante aux deux 
premiers, et plus graves, inconvenients. 


Strategie d’introduction en parallele 


La strategie d’introduction de |’echantillon en parallele 
regle les deux problemes associes a la strategie d'introduction 
progressive. En outre, le biais de renouvellement est negli- 
geable si les estimations sont fondées sur un echantillon ayant 
un profil d’ancienneté suffisamment bon. En revanche, elle a 
deux faiblesses : les couts sont eéleves, de méme que le 
fardeau impose au personnel sur le terrain dans les regions 
ou l'on demande aux intervieweurs deja en place de mener 
l'enquete aupres du nouvel échantillon tout en continuant leur 
travail aupres de l’ancien. 


Avantages 
(i) Effet de l’inexperience des nouveaux intervieweurs 
On laisse le nouvel echantillon s'accroitre pendant trois 
mois avant de se servir des donnees recueillies, ce qui 
donne aux nouveaux intervieweurs une periode de rodage 


qu'on estime suffisante. 


(ii) Charge de travail des nouveaux intervieweurs 


= 


On attribue aux nouveaux intervieweurs les 3/6 d'une 
tache complete pour commencer, et il s'agit de premieres 
interviews qui donc prennent plus de temps. Le deuxieme 
mois, on leur attribue les 4/5 d'une tache normale et le 
troisieme, les 5/6. 


(iii) Conséquences du biais de renouvellement 


Selon les calculs effectués par Ghangurde (1982), le 
biais de renouvellement est assez faible lorsque 
l'echantillon a un profil d’anciennete suffisamment 
bon pour que cela ne pose pas de probleme. 


Inconvenients 


(i) Les intervieweurs déja en place auxquels on attribue des 
ménages dans le nouvel échantillon doivent travailler sur 
les deux echantillons pendant la periode d’introduction, ce 
qui n'est possible que si la semaine d’enquéte n'est pas 
la méme dans les secteurs ou |’echantillon est introduit en 
parallele. 


(ii) The cost of extra interviews for off-line areas is 
estimated at $1.1 million compared with the 
negligible cost of the on-line scheme. 


Combined Strategy 


The combined strategy was adopted because it 
resorts to the on-line strategy wherever it is not 
problematic. This is done on the grounds that it is 
preferable in terms of both cost and field operations. 
Wherever the on-line method causes problems in 
areas affected by boundary changes and where a high 
proportion of new interviewers is required, the off- line 
method provides an effective solution. 


Under the combined strategy, the cost of extra 
interviews is estimated at $350,000 and the effect on 
rotation group biases is minimal. 


Strategy Application 


The criteria that determined how each sample 
component was phased-in were boundary changes and 
the anticipated need for new interviewers. A revision of 
Economic Region boundaries was requested by 
Alberta, Ontario and Quebec. The new ERs in Ontario 
and Alberta consisted of different groupings of Census 
Divisions, whereas in Quebec the new ERs were 
defined using provincially defined small areas know as 
Municipalités Regionales de Comté (MRC). Due to the 
lack of comparability of ERs between the old design 
and the redesign, these provinces were designated to 
be introduced off-line. 


Because of geographical difficulties in British 
Columbia and Newfoundland the new sample required 
a significant proportion of new interviewers. Hence, due 
to the above factors, Newfoundland, Quebec, Ontario, 
Alberta and British Columbia were designated as off- 
line and Prince Edward Island, Nova Scotia, New 
Brunswick, Manitoba and Saskatchewan were 
designated as on-line. 


SRUs in Off-line Provinces 


All SRUs for which the boundaries remained 
unchanged by the redesign were introduced on- line. 
In those SRUs where there was annexation or deletion, 
core areas that were collections of complete 1971 
Strata unaffected by boundary changes were intro- 
duced on-line. The 1981 strata were designed to 
respect the boundary of the so defined core. 


Exceptions in On-line Provinces 


Annexations to Census Metropolitan Areas in these 
provinces made it necessary to modify the phase-in 
stage. In Nova Scotia a significant portion of NSR from 
ER 25 was annexed to the CMA of Halifax. A core 
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(ii) Le codt estimé des interviews additionnelles lorsque 
|'echantillon est introduit en paralléle est de 1.1 million de 
dollars, alors qu'il est négligeable lorsque |’échantillon est 
introduit progressivement. 


Stratégie mixte 


La strategie mixte a été adoptee parce qu'elle permet 
d'avoir recours a l'introduction progressive, qui est preferable 
du point de vue des couts et du travail sur le terrain, partout 
ou cela ne pose pas de probleme. La ou la méthode 
d'introduction progressive pose des problemes, soit parce que 
les limites des unités ont changé ou parce qu'elle necessite 
qu'on embauche un trop grand nombre de nouveaux 
intervieweurs, la méthode d’introduction en parallele constitue 
une bonne solution de rechange. 


Avec la stratégie mixte, le cout estime des interviews 
additionnelles est de $350,000 et les biais de renouvellement 
sont minimes. 


Application de la strategie 


Les criteres sur lesquels on s'est fondé pour determiner 
comment introduire chaque partie de |’échantillon étaient les 
changements apportes aux limites et la necessite prevue 
d’embaucher de nouveaux intervieweurs. L’Alberta, l'Ontario et 
le Québec avaient demande que les limites des régions 
economiques soient modifiées. Les nouvelles RE en Ontario 
et en Alberta ont été constituees de nouveaux groupements 
de divisions de recensement, tandis qu’au Québec on est parti 
de petites régions deéfinies par la province et appelées des 
municipalités régionales de comté (MRC). Comme les RE du 
nouveau plan n’éetaient plus comparables a celles de |l’ancien, 
il a ete convenu que l’éechantillon dans ces provinces serait 
introduit en parallele. 


En Colombie-Britannique et a Terre-Neuve, il fallait, en 
raison de diffultes d’ordre geéographique, embaucher une 
proportion considérable de nouveaux intervieweurs pour le 
nouvel echantillon. Il a done eté décidé que |’échantillon de 
ces deux provinces aussi serait introduit en parallele, ce qui 
laissaitI'lle-du-Prince-Edouard, la Nouvelle-Ecosse, le 
Nouveau-Brunswick, le Manitoba et la Saskatchewan comme 
provinces ou l’échantillon serait introduit progressivement. 


UAR dans les provinces ou I’échantillon a été introduit 
en parallele 


Dans toutes les UAR ou les limites n’avaient pas changé 
avec le nouveau plan de sondage, |’échantillon a été introduit 
progressivement. Pour ce qui est de celles ou des parties 
avaient ete ajoutées ou supprimeées, on a procédé a |'intro- 
duction progressive de |’échantillon dans les parties centrales 
constituees de collections de strates de 1971 complétes non 
touchees par les changements de limites. Les strates de 
1981 ont ete formées de maniére a respecter les limites des 
parties centrales ainsi définies. 


Exceptions dans les provinces ou I’échantillon a été 
introduit progressivement 


ll a fallu modifier le plan d’introduction de |’échantillon 
dans les provinces ou il y a eu des annexions aux régions 
metropolitaines de recensement. En Nouvelle-Ecosse, une 
grande partie des secteurs NAR de la RE 25 a étéannexée a 


area consisting of the original CMA was introduced on- 
line. The remainder of the ER, including the annexed 
parts to become SR in the new design, was introduced 
off-line. 


Similarly a part of NSR from ER 61 in Manitoba 
had been added to the CMA of Winnipeg. Again, the 
core part of Winnipeg corresponding to the old CMA 
was on-line and all of ER 61 was off-line. Changes 
were also made to the CMA of Saskatoon in ER 73. All 
of this ER was introduced off-line except the apartment 
sample in Saskatoon. 


Apartment Sample 


In the redesign, 18 SR areas have separate apart- 
ment sample strata. Except for Hull, the SRUs were 
introduced on-line and therefore so was the apartment 
sample. In Saskatoon, which was to be off-line, the 
apartment sample was introduced on-line, since the 
frame is concentrated in the core. In Hull, the 
apartment sample was set up for the first time as part 
of the redesign and was introduced off-line, along with 
the SRU. 


Allocation of Sample 


As a result of applying the mixed strategy, just 
over 58% of the sample was phased in on- line. Table 
C-2 presents the new sample as a percentage of the 
total sample used for official estimates by province for 
each month during the phase-in period. 


Table C-2 


Percentage of New Sample by Month and 
Province during Redesign Sample Phase-in 
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la RMR de Halifax. Dans la partie centrale constituee de la 
RMR d'origine, |’échantillon a été introduit progressivement. 
Dans le reste de la RE, y compris les parties annexées qui 
allaient devenir AR dans le nouveau plan, |’échantillon a ete 
introduit en paralléle. 


La méme chose s'est passée au Manitoba : une partie 
des secteurs NAR de la RE 61 a été ajoutee a la RMR de 
Winnipeg. L’échantillon a été introduit progressivement dans 
la partie de Winnipeg correspondant a l’ancienne RMR et en 
parallele dans l'ensemble de la RE 61. Des changements ont 
ete apportes a la RMR de Saskatoon, dans la RE 73. 
L’echantillon a été introduit en parallele dans toute cette RE 
sauf dans la partie qui avait ete prélevee dans la base 
d’appartements de Saskatoon. 


Echantillon prélevé dans la base d’appartements 


Selon le nouveau plan de sondage, il y a des strates 
formees a partir d'une base d'appartements dans 18 UAR. 
Partout sauf a Hull, |’échantillon a ete introduit progres- 
sivement, et donc la partie prelevee dans la base d’apparte- 
ments aussi. A Saskatoon, ou |’echantillon devait étre introduit 
en parallele, la partie prelevee dans la base d’appartement a 
ete introduite progressivement, car elle etait concentree dans 
le centre de la ville. A Hull, la base d’appartements a ete 
creee dans le cadre du remaniement du plan de sondage, et 
l'échantillon qui y a été préleve a ete introduit en parallele, 
comme dans le reste de |'UAR. 


Répartition de I’échantillon 


L'adoption de la strategie mixte a eu pour consequence 
qu'un peu plus de 58% de |’échantillon a ete introduit pro- 
gressivement. Le tableau C-2 indique la proportion de 
l'échantillon utilise pour les estimations officielles qui etait 
representee par le nouvel echantillon, selon le mois et la 
province, pendant |'introduction de |’echantillon. 


Tableau C-2 


Pourcentage represente par le nouvel échantillon, selon 
le mois et la province, pendant l’introduction de 
’échantillon préleve d’apres le nouveau plan de 
sondage 


March 


October November December January February 
Octobre Novembre Décembre Janvier Fevrier Mars 
Newfoundland — Terre-Neuve 3.3 6.8 10.3 91.9 96.0 100.0 
Prince Edward Island - !le-du-Prince-Edouard 17.4 34.5 48.8 67.9 84.1 100.0 
Nova Scotia — Nouvelle-Ecosse hy. a me = - peed 
— Nouveau-Brunswick 16. , ; : , 
pee aller 6.0 122 18.4 86.9 93.3 100.0 
Ontario 9.0 17.9 26.6 83.4 91.8 100.0 
Manitoba 13.3 26.8 40.9 66.4 82.3 100.0 
Sackatchowan 11.6 23.7 36.0 73.0 86.5 100.0 
Albert 6.2 12.1 18.2 88.1 94.0 100.0 
a 100.0 


British Columbia — Colombie-Britannique 6.1 


12.2 18.4 84.9 92.8 


Sample Size Stabilization During Phase-In 


Sampling rates for the LFS are established to yield 
a desired sample size at the outset of the design. 
Over time, however, continued application of the 
original rates would result in a 2%-3% annual increase 
in the sample size, since the universe of dwellings is 
growing at this rate. 


Sample size stabilization is a step in the sample 
selection process to prevent such growth in the sample 
size. Under this step, the sample of newly selected 
dwellings each month is systematically cut back to the 
desired or "base" sample size, and corresponding 
factors to increase the weights cof non-dropped 
dwellings are introduced (Drew, 1977). In the old 
design, the sample was stabilized separately for SR 
apartments, regular SR, NSR urban and NSR rural 
within each province. 


From October to December 1984, sample stabi- 
lization was restricted to new dwellings selected under 
the old design in off-line areas. Hence, dwellings from 
the new design were split off prior to stabilization. The 
base sample sizes were reduced by theproportion of 
the old sample that was off-line in each province/area 
considered in stabilization. 


A revised stabilization program was introduced for 
January 1985. No sample was selected from the old 
design at this time although two rotations were still 
phasing out. January was thus the first month where 
the full sample selection was derived only from the 
new sample (i.e., Rotation 1). Hence, since only the 
births each month are stabilized the new sample 
became completely stabilized only in June 1985. 


The new stabilization features a more flexible 
definition of the area to be stabilized in terms of ranges 
of PSUs. Typically, CMAs and SR and NSR portions of 
Economic Regions form stabilization areas. Special 
surveys especially can now specify their own set of 
stabilization areas. 


Base figures for the redesign sample were based 
on expected households under the new sample 
allocation. These figures were determined from 1981 
Census data together with current survey estimates of 
the proportion of vacants in each stabilized area. The 
vacancy rate was required to convert households into 
dwellings since the sample is in terms of dwellings. 
The off-line new sample for October and November 
was used to finalize these base figures prior to January 
Survey sampling in the first week of December. 
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Stabilisation de la taille de l’echantillon pendant 
Vintroduction de celui-ci 


Les fractions de sondage pour |l’EPA sont etablies au 
début de |’élaboration du plan de sondage et visent a donner 
un échantillon d’une taille voulue. Cependant, si |’on con- 
tinuait d’appliquer les mémes fractions, la taille de l’échantillon 
s’accroitrait de 2 a 3% par an, car c’est la le rythme de 
croissance de I’univers des logements. 


La stabilisation de la taille de |l’échantillon est une etape 
de |’échantillonnage dont le but est de prevenir la croissance 
de |’échantillon. Elle consiste a reduire systematiquement le 
nombre de nouveaux logements échantillonnes chaque mois 
pour ramener ce nombre a une allocation de base et a intro- 
duire des facteurs ayant pour objet d’augmenter en conse- 
quence le poids des logements demeurant dans |’echantillon 
(Drew 1977). Dans l’ancien plan de sondage, on procedait 
separément a la stabilisation des echantillons preleves dans 
les UAR avec base d’appartements, dans les UAR normales, 
dans les régions urbaines ,des secteurs NAR et dans les 
regions rurales des secteurs NAR de chaque province. 


D’octobre a décembre 1984, on a limite la stabilisation de 
l’echantillon aux nouveaux logements preleves selon |l’ancien 
plan de sondage dans les régions ou |’echantillon etait intro- 
duit en parallele. Les logements preleves selon le nouveau 
plan de sondage on donc éte retires avant la stabilisation. 
Dans chaque province ou secteur soumis a la stabilisation, la 
taille de base des eéchantillons a ete diminuee proportion- 
nellement au pourcentage represente par l’ancien echantillon 
dans les secteurs ou |’échantillon a ete introduit en parallele. 


On a introduit un nouveau programme de stabilisation en 
janvier 1985. Aucune partie de |’échantillon n’était prelevee 
selon l’ancien plan de sondage a ce moment-la, quoiqu'll 
restait deux groupes de renouvellement qui terminaient leur 
cycle. Le mois de janvier etait donc le premier mois ou tout 
l’echantillon preleve |’etait uniquement selon le nouveau plan 
(autrement dit, tout le groupe de renouvellement 1). Comme 
seulement les nouveaux menages du mois sont oumis a la 
Stabilisation, ce n'est qu’en janvier 1985 que le nouvel 
echantillon a eté entierement stabilise. 


La definition de ce qui constitue un secteur de 
stabilisation en termes de tranches de codes d'UPE est plus 
souple dans le nouveau programme de stabilisation. En gene- 
ral, les RMR ainsi que les parties AR et NAR des régions éco- 
nomiques sont des secteurs de stabilisation. Il est notamment 
possible a present de décider quels secteurs seront des 
secteurs de stabilisation aux fins des enquétes spéciales. 


Les allocations de base pour |’échantillon prélevé selon le 
nouveau plan de sondage ont été établies d’apres le nombre 
prevu de meénages selon la nouvelle repartition, lequel est 
calcule au moyen des chiffres du recensement de 1981 et de 
estimation de la proportion de logements vacants dans 
chaque secteur de stabilisation d’aprés les résultats de la 
derniere enquéte. Il est nécessaire de connaitre le taux de 
logements vacants pour convertir le nombre de ménages en 
nombre de logements, |l’échantillon étant un échantillon de 
logements. On s'est servi des résultats obtenus pour |’échan- 
tillon introduit en paralléle en octobre et novembre pour 
apporter les dernieres corrections nécessaires aux allocations 
de base avant le prélevement de I’échantillon pour |’enquéte 
de janvier, la premiere semaine de décembre. 
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Diagram of the LFS Frame 


Self representing frame/ 
Cadre autorepresentatif 


Rural stratum 


Annexe D 


Diagramme de la base de I’EPA 


Province 


Economic Region 


Region Economique 


Non self representing frame: 
Cadre non autoreprésentatif 


Mixed stratum Urban stratum/ 


SR unit (city)/ Strate rurale Strate mixte Strate urbain 
Unite AR (ville) : : 
| (fppss | (rppss: | (TPpssi 
1 rppts) 1 rppts) 1 rppts) 
Regular/ = Apartments’ 
Reguliere Appartements PSUs PSUs PSUs) 
UPE UPE UPE 
Sub-unit/ Stratum/ oe Rural part Urban part Qs 
Sous-unite Strate Pe. Partie rurale Partie urb. ,” 
| (ppss \ cA ee 
| (rg/ga) i ppts) ae oe or 
; i] ‘y? Y 
Clusters/ Apt. bldgs/ i 
Grappes Immeubles d’app. 1 (rppss: | (rppssi 
' | tppts) | rppts) 
i (s) | (S) 
; : Groups Clusters 
Dwellings/ Dwellings/ Groupes Grappes 
Logements Logements 
1 (S) (4c) 
| 
Dwellings Dwellings’ 
Logements Logements 


1 
level of stratification) ! 
niveau de stratification ; 


method of selection 
méthode d’échantillonnage 


Abbreviations: 
pps — probability proportional to size 
ppss — pps systematic 
rppss — randomized pps systematic 

S — systematic 

rg — random group 


= stage of sampling/ 
etape de |’échantillonnage 


Abreviations : 


ppt —- probabilité proportionelle a la taille 
ppts — ppt et tirage systematique 

rppts — ppts avec classement aleatoire 

s -— systematique 

ga —- groupe aleatoire 


Special area frame 
Region speciale 


Stratum 
Strate 


| (rppss 
! rppts) 


| 
Clusters (optional) 
Grappes (facultatif) 


' (s) 


Dwellings 
Logements 
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Appendix E Annexe E 


Map 0.1 


Legend 
Economic Region 


Principal Self- 
Representing Unit 


Other Self- 
Representing Units 


LABRADOR 


@ 4 


Legende 
Region economique 


Principale unite 
autorepresentative 


Autres unites 
autorepresentatives 


NEWFOUNDLAND — TERRE- NEUVE 


Carte 0.1 


Newfoundland 
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: Terre-Neuve 
able 0.2 
Tableau 0.2 
Non Self-Repr i ite 5 ‘ 
presenting Areas Unités non autoreprésentatives 
Economic 
ae Stratum Stratum LF Number Number ISR2 
Type Population! of PSUs selected 
Region 
Snide Strate Type de Population Nombre Nombre Fsl2 
strate active! de UPE sélectionne 
010 01000 urban/urbaine 14068 7 2 49 
01020 rural/rurale 15506 9 2 49 
01040 rural/rurale 18708 9 2 49 
020 02000 rural/rurale 9916 7 2 32 
02020 mixed/mixte 11105 vA 2 32 
030 03000 rural/rurale 14943 if 2 49 
03020 rural/rurale 13849 Ti 2 49 
03040 rural/rurale 14558 if 2 49 
040 04000 urban/urbaine 15504 9 2 49 
04020 urban/urbaine 15050 8 2 49 
04040 rural/rurale 15471 10 2 49 
04060 rural/rurale 15656 10 2 49 
04080 rural/rurale 17600 10 2 49 
TOTAL 13 - 191934 107 26 - 
1 Non-institutional civilian population 15 years and over. — Personnes civiles non pensionnaires d'institution 4gees de 15 ans et plus 
Inverse sampling rate. - Fraction de sondage inverse 
ER CD COMPOSITION 
RE COMPOSITION en DR 
010 Division 1 
020 Divisions 2, 3 
030 Divisions 4, 5, 9, 10 
040 Divisions 6, 7, 8 
Table 0.3 Tableau 0.3 
Self-Representing Area List Liste des unités autorepresentatives 
Serial Name of SRU 1981 LF No. Of Numerical Economic Cluster Design 
No.! Population Sub-Units Identification Region Design2 ISR3 
No. de Nom de !'UAR Population No. de Code Region Formation FSI 
Série! active de sous- d'identifi- econo- des selon 
1981 unites cation mique grappes@ le plan3 
1 St. John's 111810 16 01101 010 BF/EA 68(91) 
2 Carbonear 7520 2 01201 010 VR 68 
3 Wabana-Bell Island 3354 1 01301 010 VR 68 
4 Marystown 7415 1 02101 020 VR 32 
5 Channel-Port aux Basques S115 1 02201 020 VR 32 
6 Fortune-Grand Bank 4358 1 02301 020 VR 32 
7 Corner Brook 18337 2 03101 bees it gl 
8 Labrador-Wabush 9441 2 03201 030 VR 68 
9 Stephenville 7664 2 03301 030 VR 68 
10 Happy Valley-Goose Bay 4557 1 03401 030 VR 68 
aI Windsor-Grand Falls 10349 l 04101 i be Sel 
12 Gander 7216 2 04201 040 VR 68 
TOTAL 197136 32 


1 As on the map. - Voir la carte. 


ZI sates = 
VR = 
EA = 
3 ISR) = 


Block-face counts from Area Master File used to form clusters 
Counts derived from Visitation Records used to form clusters 
Enumeration Areas used to form clusters 
Inverse Sampling Rat 
Fraction de sondage inverse (apre 


5 la reduction de /a taille de 'echantillon en 1986). 


- Utilisant les chiffres pour les cétés d7lots provenant du fichier principal des regions 
- Utilisant les chiffres provenant des registres des visites 
- Utilisant les secteurs de denombrement 
e. — (after 1986 sample reduction) 
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Prin 7 ; - 
ce Edward Island lle-du-Prince-Edouard 
Table 1.2 Tableau 1.2 
N a j Sau - F 
on Self-Representing Areas Unités non autoreprésentatives 
ae mean Stratum fe Number Number ISR2 
g Type3 Population! of PSUs selected 
Region — Strate Type de Population Nombre Nombre Fsl@ 
economique strate? active! de UPE selectionne 
me 10000 EA 62381 12 12 25 
U Non-institutional. civilian population 15 year and over. - Personnes civiles non pensionnaires d'institution ageées de 15 ans et plus. 
Inverse sampling rate. — Fraction de sondage inverse 
Special design consisting of Enumeration Areas selected as PSUs. - Plan de sondage special consistant de SD 
Table 1.3 Tableau 1.3 
Self-Representing Area List Liste des unites autoreprésentatives 
Serial Name of SRU 1981 LF No. Of Numerical Economic Cluster Design 
No.! Population Sub-Units Identification Region Design2 ISR3 
No. de Nom de !'UAR Population No. de Code Region Formation FSI 
Série! active de sous- d'identifi- econo- des selon 
1981 unites cation mique grappes@ le plan3 
1 Charlottetown 19361 9 10101 100 VR 30 
2 Summerside 8029 4 10201 100 VR 30 
TOTAL 27390 13 - - = = 
1 As on the map. - Voir la carte 
2 VR = Counts derived from Visitation Records used to form clusters. - Utilisant les chiffres provenant des registres des visites 
3 ISR = Inverse Sampling Rate. - (after 1986 sample reduction) 
FSI = Fraction de sondage inverse (apres la reduction de la taille de l'echantillon en 1986) 
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Nova Scotia 


Table 2.2 


Non Self-Representing Areas 
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Nouvelle-Ecosse 


Tableau 2.2 


Unites non autoreprésentatives 


Si Stratum Stratum LF Number Number ISR2 
g Type Population! of PSUs selected 
Region - Strate Type de Population Nombre Nombre Fsl@ 
economique strate active! de UPE selectionne 
210 21000 urban/urbaine 33836 17 3 90 
220 22000 urban/urbaine 20669 5 2 90 
22020 rural/rurale 19917 13 2 90 
22040 rural/rurale 21842 13 2 90 
22060 rural/rurale 22767 13 2 90 
230 23000 urban/urbaine 9923 5 2 50 
23020 rural/rurale 14485 10 2 50 
23040 rural/rurale 15277 10 2 50 
23060 rural/rurale 13150 7 2 50 
23080 rural/rurale 12914 if 2 50 
240 24000 urban/urbaine 10306 5 2 50 
24020 rural/rurale 25012 14 3 50 
24040 rural/rurale 22293 14 3 50 
24060 rural/rurale 21149 14 3 50 
250 25080 EA dsgn/SD 7951 1 1 90 
TOTAL 15 - 271491 148 a3 - 
1 Non-institutional civilian population 15 year and over. - Personnes civiles non pensionnaires d institution agées de 15 ans et plus 
Inverse sampling rate. - Fraction de sondage inverse 
ER CD COMPOSITION 
ER COMPOSITION EN DR 
210 Divisions 15,16,17,18 
220 Divisions 10,11,12,13,14 
230 Divisions 05,07 ,08 
240 Divisions 01,02,03,04,06 
250 Division 09 
Table 2.3 Tableau 2.3 
Self-Representing Area List Liste des unites autorepresentatives 
Serial Name of SRU 1981 LF No. Of Numerical Economic Cluster Design 
No.! Population Sub-Units Identification Region Design ISR3 
No. de Nom de |'UAR Population No. de _ Code Region Formation FSI 
ened active de sous- d'identifi- econo- Oe. ae 
1981 unites cation mique grappes le plan 
ney-Glace Ba 65223 9 21101 210 VR 80(100) 
: Sane) Mines : 24709 3 21201 dite — an 
3 New Glasgow 17832 3 22101 220 VR 58 
4 haw 14700 2 22201 220 VR 58 
5 Kentville 7224 1 23101 230 VR 50 
3 230 VR 50 
6 Kingston-Greenwood 3526 1 23201 
ié Yarmouth 5769 L odds oa) ci Bo 
5259 1 24201 240 VR 50 
8 Bridgewater = 430 240 VR 50 
9 Liverpool 4857 A e801 
16 alikax 206024 26 25101 250 rjieom 90(120) 
Halifax APT 1 25100 250 A 90(120) 
5123 48 REGULAR 
TOTAL 35 ; nee 
1 As onthe map. - Voir la carte ~~ T 
= ed to form clusters. - Utilisant les chiffres pour les cotes dilots provenant du fichier principal des regions 
; vA = ee vac caros ied to form clusters. - Utilisant les chiffres provenant des registres des visites 
EA = £numeration Areas used to form clusters. - Utilisant les secteurs de irate oa 
APT = Apartment Buildings used to form clusters. ~ Utilisant les immeubles d’appartements 
3 ISR = Inverse Sampling Rate. - (after 1986 sample reduction) 


Fraction de sondage inverse (apres la reduction d 


e fa taille de !'echantillon en 1986) 
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Nouveau-Brunswick 


Tableau 3.2 


Unites non autoreprésentatives 


ae Stratum Stratum LF Number Number ISR2 
9 Type Population! of PSUs selected 

Region Strate Type de Population Nombre Nombre FSI2 

economique strate active! de UPE sélectionne 

310 31000 urban/urbaine 13488 6 2 60 
31020 rural/rurale 18526 11 2 60 
31040 rural/rurale 18350 11 2 60 
31060 rural/rurale 16633 11 2 60 
31080 rural/rurale 19806 11 2 60 

320 32000 urban/urbaine 12401 5 2 60 
32020 rural/rurale 18425 11 2 60 
32040 rural/rurale 15486 11 2 60 

330 33000 mixed/mixte 19969 12 2 60 
33020 mixed/mixte 16980 te 2 60 

340 34000 rural/rurale 21373 13 2 60 
34020 rural/rurale 18298 13 2 60 

350 35000 urban/urbaine 8010 5 2 45 
35020 rural/rurale 10388 9 2 45 
35040 rural/rurale 11254 9 2 45 
35060 rural/rurale 12101 9 2 45 

TOTAL 16 - 251488 159 32 ~ 

1 Non-institutional civilian population 15 year and over. — Personnes civiles non pensionnaires d institution 4gees de 15 ans et plus 

Inverse sampling rate. - Fraction de sondage inverse 

ER CD COMPOSITION 

RE COMPOSITION EN DR 

310 Divisions 09,14,15 

320 Divisions 06,07,08 

3830 Divisions 01,02,05 

340 Divisions 03,04,10 

350 Divisions 11,12,13 

Table 3.3 Tableau 3.3 

Self-Representing Area List Liste des unites autorepresentatives 

Serial Name of SRU 1981 LF No. Of Numerical Economic Cluster Design 

No.! Population Sub-Units Identification Region Design2 ISR3 

No. de Nom de I'UAR Population No. de Code Region Formation FSI 

Série! active de sous- d'identifi- econo- des selon 

1981 unites cation mique grappes le plan3 

1 Dalhousie-Campbellton 14324 a 31301 310 VR 60 

2 Bathurst 14243 i Ailes hh! aes we 

3 Chatham/Newcastle 13125 a $1204 310 NB 45 

4 Moncton 74448 13 32101 320 BF/EA 60(80) 

& Saint John 84917 18 33101 330 BF/EA 60(80) 

6 Fredérittaln 33820 11 34101 340 BF/EA 45(56) 

i Oromocto 4273 e ei — ch ee 

8 Edmundston 13400 : oa ae i s 

g Grand Falls 4477 1 35201 350 VR 45 

TOTAL 257027 61 


4 As on the map. - Voir la carte. 
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Block-face counts from Area Master File used to form clusters 
Counts derived from Visitation Records used to form clusters 
Enumeration Areas used to form clusters 


Inverse Sampling Rate. - (after 1986 sample reduction) 


Fraction de sondage inverse (apres !a re 


duction de Ia taille de !'echantillon en 1986) 


~ Utilisant les chiffres pour les cétes dilots provenant du fichier principal des regions 
- Utilisant les chiffres provenant des registres des visites 
- Utilisant les secteurs de denombrement 
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Quebec Québec 


Table 4.2 
Non Self-Representing Areas 


Tableau 4.2 
Unites non autoreprésentatives 


Economic Stratum Stratum LF Number Number ISR2 
Region Type Population! of PSUs selected 
Region Strate Type de Population Nombre Nombre Fsl@ 
economique strate active! de UPE selectionne 
411 41000 mixed/mixte 71876 13 3 150 
412 41020 urban/urbaine 55545 12 2 220 
41040 rural/rurale 79469 17 2 220 
420 42000 mixed/mixte 73168 16 2 245 
430 43000 mixed/mixte 86145 16 2 245 
43020 mixed/mixte 80858 16 2 245 
43040 mixed/mixte 72587 14 2 245 
440 44000 mixed/mixte 68794 16 2 245 
44020 mixed/mixte 84045 16 2 245 
450 45000 urban/urbaine 48975 12 2 245 
45020 rural/rurale 54821 16 2 245 
461 46000 mixed/mixte 95537 18 3 245 
46020 mixed/mixte 105788 18 3 245 
463 46040 mixed/mixte 108955 18 3 245 
464 46060 mixed/mixte 48516 12 2 150 
46080 mixed/mixte 41822 14 2 150 
470 47000 mixed/mixte 54485 16 2 245 
480 48000 mixed/mixte 61648 16 3 150 
TOTAL 18 ~ 1293034 276 41 - 


7 


Non-institutional civilian population 15 year and over. - Personnes civiles non pensionnaires d institution agees de 15 ans et plus 


Inverse sampling rate. - Fraction de sondage inverse 


ER 


CD COMPOSITION 


RE 


COMPOSITION EN DR 


400 
411 
412 
420 
430 
440 
450 
461 
462 
463 
464 
470 
480 
490 


Divisions 98PT (REMOTE/ ELOIGNEES) 

Divisions 01,02,03,04PT,O6PT 

Divisions 04PT,05,06PT,07,08,09,10 

Divisions 17PT,90,93,94,98PT 

Divisions 11,12,13,14,15,16,17PT,20PT,21,22,23,24PT, 26PT,27PT,28PT,29PT,97PT 
Divisions 20PT,26PT,27PT,28PT,29PT,32,33,34PT,41,42PT, 43PT,47PT,84PT 
Divisions 24PT,25,26PT, 34PT,35,36,37,38PT,39PT 

Divisions 38PT,39PT,40,42PT,50,51,52,53,54,55,56,57, 66,67,68,69,70,71,72 
Divisions 64,65 

Divisions 47PT,49PT,58PT,61PT,63PT,73,74,75PT,76,78PT 

Divisions 43PT,47PT,49PT,58PT,61PT,62,63PT 

Divisions 75PT,78PT,79,80PT 

Divisions 80PT,83,84PT 

Divisions 97PT,98PT (REMOTE and SRU ONLY/éloignees et UAR seulement) 


Quebec 


Table 4.3 


Self-Representing Area List 


hoz 


Quebec 
Tableau 4.3 


Liste des unités autoreprésentatives 


Serial Name of SRU 1981 LF No. Of Numerical Economic Cluster Design 
No.! Population Sub-Units \dentification Region Design? ISR 
No. de Nom de |'UAR Population No. de Code Region Formation FSI 
Série! active de sous- d'identifi- econo- des selon 
1981 unites cation mique grappes@ le plan3 
1 Gaspe 12830 1 41201 411 VR 40 
2 Rimouski 24536 2 41101 412 VR 84 
3 Chicoutimi-Jonquiere 101125 an 42101 420 BF/EA 128 
4 Alma 19371 1 42201 420 VR 286 
5 La Baie 14656 1 42301 420 VR 286 
6 Ville de Quebec 438442 19 43101 430 BF/EA 320 (356) 
BART. 1 43100 430 APT 320 (356) 
if Thetford Mines Shine 1 43201 430 VR 286 
8 Trois Rivieres 87284 8 44101 440 BF/EA 128 
9 Shawinigan 43479 2 44201 440 VR 286 
10 Drummondville 34451 2 44301 440 VR 286 
11 Victoriaville 25242 1 44401 440 VR 286 
12 Sherbrooke 89365 8 45101 450 BF/EA 128 
13 Montreal 2224374 51 46101 462 BF/EA 444 (666) 
12 46200 461 BF/EA 444 (666) 
i 10 46220 462 BF/EA 286 (429) 
1 5 46240 463 BF/EA 286 (429) 
4 46250 464 BF/EA 286 (429) 
SARI 4 46100 462 API 444 (666) 
APT 1 46200 461 APT. 444 (666) 
" APT 1 46220 462 APT 286 (429) 
14 St-Jean 39574 2 46301 461 VR 286 
15 Granby 34319 2 46601 461 VR 286 
16 Sorel 33337 2 46501 461 VR 286 
17 Saint-Hyacinthe 31707 a 46401 461 VR 286 
18 Salaberry-De-Valleyfield 30897 2 46801 461 VR 286 
19 St-Jerome 29167 2 46701 463 BF/EA 286 
20 Joliette 24031 1 46811 464 VR 286 
21 Hull 128079 10 47101 470 BF/EA 186 (248) 
YANN 1 47100 470 APT 186 (248) 
22 Val D'Or 21132 1 48201 480 VR 150 
23 Rouyn/Noranda 19947 1 48101 480 VR 150 
24 Sept lles 29533 2 49101 490 VR 105 
25 Baie-Comeau 24735 2 49201 490 VR 84 
TOTAL 3584785 168 REGULAR 
8 APT 
1 As on the map. - Voir la carte. 
2 BF = Block-face counts from Area Master File used to form clusters. - Utilisant les chiffres pour les cotés d7lots provenant du fichier principal des régions. 
VR = Counts derived from Visitation Records used to form clusters. - Utilisant les chiffres provenant des registres des visites. 
EA = E£numeration Areas used to form clusters. - Utilisant les secteurs de deénombrement. 
APT = Apartment Buildings used to form clusters. - Utilisant les immeubles d'appartements. 
3 {SR = Inverse Sampling Rate. - (after 1986 sample reduction). 
FS! = Fraction de sondage inverse (apres /a reduction de la taille de l'echantillon en 1986). 
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Ontario 
Tableau 5.2 


Unités non autoreprésentatives 


ar Stratum Stratum LF Number Number ISR2 
g Type Population! of PSUs selected 
Region Strate Type de Population Nombre Nombre FSI2 
economique strate active! de UPE sélectionne 
500 50000 urban/urbaine 68323 14 v2) 286 
50020 rural/rurale 107888 19 3 286 
510 51000 urban/urbaine 53308 13 2 286 
51020 rural/rurale 96723 19 3 286 
520 52000 urban/urbaine 52946 11 2 190 
52020 rural/rurale 45217 14 2 190 
52040 rural/rurale 53799 14 2 190 
530 53000 urban/urbaine 18154 7 2 286 
53080 EA dsgn/SD 22250 1 1 286 
540 54000 mixed/mixte 64649 15 2 286 
54020 mixed/mixte 65901 16 2 286 
54040 mixed/mixte 69216 16 2 286 
550 55000 mixed/mixte 94286 17 Z 286 
560 56000 mixed/mixte 84601 16 2 286 
570 57000 mixed/mixte 114303 18 3 286 
57080 EA dsgn/SD 11760 1 1 286 
580 58000 mixed/mixte 41860 v2 2 150 
58020 mixed/mixte 38869 12 2 150 
58040 mixed/mixte 36515 12 2 150 
58060 mixed/mixte 39170 12 2 150 
591 59000 mixed/mixte 64725 16 2 278 
59020 mixed/mixte 85718 16 2 278 
592 59040 urban/urbaine 46382 14 2 190 
TOTAL 23 - 1376563 305 47 - 


1 


Non-institutional civilian population 15 years and over. - Personnes civiles non pensionnaires d'institution agees de 15 ans et plus 


Inverse sampling rate. - Fraction de sondage inverse 


ER 


CD COMPOSITION 


RE COMPOSITION EN DR 


500 
510 
520 
530 
540 
550 
560 
570 
580 
591 
592 


Divisions 01,02,03,04,05,06,07,08,09 


Divisions 10,11,12,13,47 
Divisions 14,15,16,44,46 
Divisions 18,19,20,21,24PT 


Divisions 22,23,30,43 


Divisions 24PT,25,26, 28,29 


Divisions 32,34,39 
Divisions 36,37 ,38 
Divisions 31,40,41,42 


Divisions 48,49,51,52,53,54,56,57,60PT 


Divisions 58,59,60PT 


Ontario 


Table 5.3 


Self-Representing Area List 
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Ontario 
Tableau 5.3 


Liste des unités autoreprésentatives 


Serial Name of SRU 1981 LF No. Of Numerical Economic Cluster Design 
No.! Population Sub-Units Identification Region Design2 ISR3 
No. de Nom de I'UAR Population No. de Code Region Formation FSI 
Série! active de sous- d'identifi- econo- des selon 
1981 unites cation mique grappes2 le plan3 
1 Ottawa 424149 17 50101 500 BF/EA 340 (454) 
™ APT, Zz 50100 500 APT 340 (454) 
2 Cornwall 35727 2 50201 500 VR 130 
3 Kingston 71497 4 51101 510 BF/EA 286 
4 Belleville-Trenton 43134 3 51201 510 BF/EA 286 
5 Peterborough 51848 4 52101 520 VR 190 
6 Toronto 2356595 62 53101 530 BF/EA 400 (600) 
Toronto 53601 530 BF/EA 400 (600) 
mA 12 53100 530 APT 400 (600) 
rite ly 53600 530 APT 400 (600) 
if Oshawa 115105 8 53201 530 BF/EA 170 
APT 1 53200 530 APT 170 
8 Halton Hills 26263 1 53301 , 930 VR 307 
9 Newcastle 23940 1 53401 530 VR 307 
10 Milton 19905 1 53501 530 VR 307 
11 Kitchener-Waterloo 217326 11 54101 540 BF/EA 307 
> AED 1 54100 540 APT 307 
12 Guelph 56735 5 54201 540 BF/EA 190 
13 Barrie 41943 2 HAS i 540 VR 307 
14 Hamilton-Burlington 422357 15 55101 550 BF/EA 340 (378) 
ets 2 55100 550 APT 340 (378) 
15 St. Catharines-Niagara 236366 10 55201 550 BF/EA 307 
SNR AT 1 55200 550 APT 307 
16 Brantford 67038 4 55301 550 VR 246 
17 Fort Erie 18748 1 55401 550 VR 307 
18 London 219546 11 56101 560 BF/EA 307 
APT 1 56100 560 APT 307 
19 St. Thomas 28618 1 56201 560 VR 307 
20 Woodstock 26909 1 56301 560 VR 307 
21 Windsor 187955 9 57101 570 BF/EA 286 
* APT 1 57100 570 APT 286 
22 Sarnia 63615 4 57201 570 BF/EA 246 
23 Chatham 30287 2 57301 570 VR 307 
24 Stratford 20438 2 58101 580 VR 150 
25 Owen Sound 15245 1 58201 580 VR 150 
26 Sudbury 111058 9 59101 591 BF/EA 150 
27 Sault Ste. Marie 62859 4 59201 591 BF/EA 190 
28 North Bay 39866 4 59301 591 BF/EA 150 
29 Timmins 32816 2 59401 591 VR 307 
30 Elliot Lake 11032 1 59501 591 VR 150 
31 Kirkland Lake 8957 1 59601 591 VR 150 
32 Thunder Bay 92977 11 59701 592 BF/EA 130 
33 Kenora-Keewatin 11664 1 59801 592 VR 130 
TOTAL 5192518 215 REGULAR 
21 APT 
u As onthe map. - Voir la carte. 
2 BF = Block-face counts from Area Master File used to form clusters. - Utilisant les chiffres pour les cotés dilots provenant du fichier principal des regions. 
VR = Counts derived from Visitation Records used to form clusters. - Utilisant les chiffres provenant des registres des visites. 
EA = Enumeration Areas used to form clusters. - Utilisant les secteurs de dénombrement. 
APT = Apartment Buildings used to form clusters. - Utilisant les immeubles d'appartements. 
3 ISR = Inverse Sampling Rate. - (after 1986 sample reduction). 
FSI = Fraction de sondage inverse (apres la reduction de la taille de |!'échantillon en 1986). 
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Manitoba 
Tableau 6.2 
Unités non autoreprésentatives 


Economic Stratum Stratum [I Number Number ISR2 
Region Type Population! of PSUs selected 
Region Strate Type de Population Nombre Nombre Fsl2 
economique strate active! de UPE selectionne 
610 61000 urban/urbaine 9996 2 55 
61020 rural/rurale 13380 10 2 55 
61040 rural/rurale 16172 10 2 55 
620 62000 urban/urbaine 12307 5 3 40 
62020 rural/rurale 11807 8 2 40 
62040 rural/rurale 11025 8 2 40 
630 63000 urban/urbaine 16207 11 2 65 
63020 rural/rurale 17400 12 2 65 
63040 rural/rurale 18558 12 2 65 
640 64000 rural/rurale doi 8 2 40 
64020 rural/rurale 10360 8 2 40 
650 65000 rural/rurale 15831 10 2 65 
65020 mixed/mixte 15819 10 ; 2 65 
660 66000 rural/rurale 17637 10 2 65 
66020 rural/rurale 18411 10 2 65 
TOTAL 15 - 216461 137 31 
1 Non-institutional civilian population 15 years and over. - Personnes civiles non pensionnaires d'institution 4gées de 15 ans et plus. 
< Inverse sampling rate -— Fraction de sondage inverse 
ER CD COMPOSITION 
RE COMPOSITION EN DR 
610 Divisions 01,02,12 
620 Divisions 03,04 
630 Divisions 05,06,07,15 
640 Divisions 08,09,10 
650 Divisions 16,17,20 
660 Divisions 13,14,18 
670 Division 11 (GRU ONLY/UAR seulement) 
680 Divisions 19,21,22,23 (REMOTE and SRU ONLY / eloignees et UAR seulement) 
Table 6.3 Tableau 6.3 
Self-Representing Areas List Liste des unites autoreprésentatives 
Serial Name Of SRU 1981 LF No. Of Numerical Economic Cluster Design 
No.! Population Sub-Units Identification Region Design2 ISR3 
No. de Nom de Population No. de Code Region Formation FSI 
Serie! 'UAR active de sous- d'identifi- econo- des selon 
1981 unites cation mique grappes@ le plans 
1 Brandon 27257 5 63101 630 VR 80 
2 Portage La Prairie 9257 2 64101 640 VR 40 
3 Dauphin 7140 1 65101 650 VR 80 
4 Winnipeg 453441 1 61101 610 EA 117(156) 
- 1 66101 660 EA 117(156) 
53 67101 670 BF/EA 117 (156) 
67201 670 BF/EA 117(156) 
" APT 2 67100 670 APT 117(156) 
" APT 67200 670 APT 117(156) 
5 Selkirk 7161 Hl 66201 660 VR 80 
6 Flin Flon/The Pas 10392 2 68201 680 VR 80 
ih Thompson 9486 2 68101 680 VR 80 
TOTAL 524134 68 REGULAR 
2 APT 


As on the map. - Voir la carte 


> 
D 
4 

he MT now ou 


Block-face counts from Area Master File used to form clusters. - Utilisant les chiffres pour Is cétés d7lots provenant du fichier principal des regions. 
Counts derived from Visitation Records used to form clusters. - Utilisant les chiffres provenant des registres des visites. 
Enumeration Areas used to form clusters. - Utilisant les secteurs de dénombrement. 

Apartment Buildings used to form clusters. - Utilisant les immeubles d’appartements. 

inverse Sampling Rate (after 1986 sample reduction). 

Fraction de sondage inverse (apres la réduction de /a taille de I'échantillon en 1986). 
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Saskatchewan 


Tableau 7.2 


Unités non autorepresentatives 


Economic Stratum Stratum LF Number Number ISR2 
Region Type Population! of PSUs selected 
Region Strate Type de Population Nombre Nombre Fsl2 
économique strate active! de UPE sélectionne 
710 71000 rural/rurale 18929 13 pe 75 
71020 rural/rurale 18782 13 2 75 
71040 rural/rurale 17901 13 2 75 
720 72000 rural/rurale 18799 iS @ 75 
72020 rural/rurale 18821 13 2 75 
72040 mixed/mixte 17181 163 2 75 
730 73000 urban/urbaine WAS 11 2 HS 
73020 rural/rurale 22480 13 2 5 
73040 rural/rurale 18218 13 2 75 
73080 EA dsgn/SD 4009 1 1 75 
740 74000 urban/urbaine 16424 11 S 45 
74020 rural/rurale 13423 9 2 45 
74040 rural/rurale 12067 9 2 45 
74060 rural/rurale 12407 9 : 2 45 
74080 rural/rurale 11522 9 2 45 
750 75000 urban/urbaine 18571 10 2 75 
75020 rural/rurale 18927 13 2 75 
75040 rural/rurale 21654 13 2 m5) 
75060 rural/rurale 18339 13 2 a5 
75080 rural/rurale 20620 13 2 75 
TOTAL 20 - 336447 225 40 ~ 
1 Non-institutional civilian population 15 years and over. - Personnes civiles non pensionnaires d institution agees de 15 ans et plus. 
Inverse sampling rate. - Fraction de sondage inverse. 
ER CD COMPOSITION 
RE COMPOSITION EN DR 
710 Divisions 01,02,06 
720 Divisions 03,04,07,08 
730 Divisions 11,12,13 
740 Divisions 05,09,10 
750 Divisions 14,15,16,17 
760 Division 18 (remote only / eloignees seulement) 
Table 7.3 Tableau 7.3 
Self-Representing Area List Liste des unités autoreprésentatives 
Serial Name Of SRU 1981 LF No. Of Numerical Economic Cluster Design 
No.! Population Sub-Units Identification Region Design? ISR3 
No. de Nom de Population No. de Code Region Formation FSI 
Série! 'UAR active de sous- d'identifi- econo- des selon 
1981 unites cation mique grappes? le plan3 
1 Regina 123264 30 71101 710 BF/EA 61(81) 
2 Weyburn 7147 2 71201 710 VR 45 
3} Estevan 6942 2 71301 710 VR 45 
4 Moose Jaw 25351 8 72101 720 VR 45(56) 
5 Swift Current 11354 3 72201 720 VR 45 
6 Saskatoon 117953 30 73101 730 BF/EA 61(81) 
"APT 1 73100 730 APT 61(81) 
7 Battleford 2450 1 73201 730 VR 45 
8 Yorkton 11750 3 74101 740 VR 45 
9 Melville 3968 1 74201 740 VR 45 
10 Prince Albert 22507 6 75101 750 VR 45 
11 North Battleford 10606 $) 75201 750 VR 45 
12 Lloydminster 4431 1 75401 750 VR 45 
13 Melfort 4417 1 75301 750 VR 45 
TOTAL 352140 91 REGULAR 
1 APT 


NM 


As on the map. - Voir la carte 
Block-face counts from Area Master File used to form clusters. - Utilisant les chiffrees pour les cétés d7lots provenant du fichier principal des regions. 
Counts derived from Visitation Records used to form clusters. - Utilisant les chiffres provenant des registres des visites. 
Enumeration Areas used to form clusters. - Utilisant les secteurs de dénombrement 

Apartment Buildings used to form clusters. - Utilisant les immeubles d'appartements. 
Inverse Sampling Rate (after 1986 sample reduction). 
Fraction de sondage inverse (apres la reduction de /a taille de I'echantillon en 1986. 
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Alberta 


Tableau 8.2 


Unites non autorepresentatives 


Economic Stratum Stratum LF Number Number ISR2 
Region Type Population! of PSUs selected 
Region Strate Type de Population Nombre Nombre Fsi@ 
economique strate active! de UPE selectionne 
810 81000 urban/urbaine 30280 tz 2 160 
81020 rural/rurale 38546 16 2 160 
820 82000 urban/urbaine 16586 9 3 45 
82020 rural/rurale 23324 11 4 45 
82040 rural/rurale 19441 14 ) 45 
830 83000 mixed/mixte 45834 16 2 160 
83080 EA dsgn/SD 8099 1 1 160 
840 84000 urban/urbaine 18656 6 3 45 
84020 urban/urbaine 16124 6 3 45 
84040 rural/rurale 17038 9 3 45 
84060 rural/rurale 20484 9 3 45 
850 85000 urban/urbaine 20495 6 2 100 
85020 rural/rurale 33272 15 3 100 
860 86000 urban/urbaine 31759 6 2 160 
86020 rural/rurale 35920 16 2 160 
86080 EA dsgn/SD 4315 1 1 160 
870 87000 urban/urbaine 23694 12 3 60 
87020 rural/rurale 24091 10 3 60 
880 88000 urban/urbaine 30997 10 3 100 
88020 rural/rurale 45079 16 3 100 
TOTAL 20 - 504034 198 52 - 
1 Non-institutional civilian population 15 years and over. - Personnes civiles non pensionnaires d'institution agées de 15 ans et plus. 
Inverse sampling rate. - Fraction de sondage inverse 
ER CD COMPOSITION 
RE COMPOSITION EN DR 
810 Divisions 01,02,03 
820 Divisions 04,05,07 
830 Division 06 
840 Divisions 09,13,14 
850 Division 08 
860 Division 11 
870 Division 15 
880 Divisions 10,12 
Table 8.3 Tableau 8.3 
Self-Representing Area List Liste des unités autoreprésentatives 
Se Name Of SRU 1981 LF No. Of Numerical Economic Cluster Design 
No. Population Sub-Units Identification Region Design2 ISR3 
No ce Nom de Population No. de Code Region Formation Fol 
Serie l'UAR active de sous- d'identifi- econo- des selon 
1981 unites cation mique grappes@ le plan3 
1 Lethbridge 41580 Tf 81101 810 VR 50 
2 Medecine Hat 33294 6 81201 810 VR 50 
3 Drumheller 4620 1 82101 820 VR 40 
‘: Calgary 457764 47 83101 830 BF/EA 142(184) 
APT. 2 83100 830 APT 142(184) 
5 Red Deer 33890 6 85101 850 VR 50 
6 ee 501189 51 86101 860 BF/EA 142 (184) 
i 86201 860 BF/EA 142(184) 
d APT 2 86100 860 APT 142(184) 
APT 86200 860 APT 142(184) 
ie Grande Prairie 17650 3 87101 870 VR 35 
8 Fort McMurray 21286 3 88101 880 VR 35 
9 Lloydminster 6733 1 88201 880 VR 100 
TOTAL 1118006 125 REGULAR 
4 APT 


1 Ason the map. - Voir la carte. 
eee fale = 


VR = Counts derived from Visitation Records used to form clusters. 
EA = 
APT = 
3 ISR = Inverse Sampling Rate (after 1986 sample reduction). 
FSE = 


Block-face counts from Area Master File used to form clusters. - Utilisant les chiffres 


Enumeration Areas used to form clusters. - Utilisant les secteurs de dénombrement. 
Apartment Buildings used to form clusters. - Utilisant les immeubles d'appartements. 


Fraction de sondage inverse (apres la reduction de Ia taille de I'échantillon en 1986) 


ti ’ pour les cdteés dilots provenant du fichier principal des régions. 
- Utilisant les chiffres provenant des registres des visites. 
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British Columbia Colombie-Britannique 
Table 9.2 Tableau 9.2 
Non Self-Representing Areas Unités non autorepresentatives 
Economic Stratum Stratum LF Number Number ISR2 
Region Type Population! of PSUs selected 
Region Strate Type de Population Nombre ; Nombre FSl2 
economique strate active! de UPE selectionne 
910 91000 urban/urbaine 9962 4 2 45 
91020 rural/rurale 11790 if 2 45 
920 92000 urban/urbaine 28427 7 2 100 
92020 rural/rurale 41267 16 3 100 
930 93000 mixed/mixte 60241 16 3 180 
940 94000 mixed/mixte 37801 13 4 97.5 
950 95000 rural/rurale 26526 10 2 180 
960 96000 urban/urbaine 59360 13 3 180 
96020 rural/rurale 35901 16 2 180 
96040 rural/rurale 44352 16 2 180 
970 97000 mixed/mixte 80805 18 4 135: 
980 98080 EA dsgn/SD 14165 1 1 140 
TOTAL 12 - 450597 137 30 - 
!  Non-institutional civilian population 15 years and over. - Personnes civiles non pensionnaires d'institution agees de 15 ans et plus. 
2 Inverse sampling rate. - Fraction de sondage inverse. 
ER CD COMPOSITION 
RE COMPOSITION EN DR 
910 Division 01 
920 Divisions 03,39 
930 Divisions 05,07,35,37 
940 Divisions 31,33 
950 Divisions 09,11,13,15,27,29 
960 Divisions 17,19,21,23,25,43 
970 Divisions 41,51,53 
980 Division 55 
990 Divisions 45,47,49,57 (REMOTE and SRU ONLY / eloignees et UAR seulement) 
Table 9.3 Tableau 9.3 
Self-Representing Area List Liste des unités autorepreésentatives 
Serial Name Of SRU 1981 LF No. Of Numerical Economic Cluster Design 
No.! Population Sub-Units Identification Region Design ISR3 
No. de Nom de Population No. de Code Region Formation FSI 
Série! 'UAR active de sous- d'identifi- econo- des selon 
1981 unites cation mique grappes@ le plan3 
1 Cranbrook 11631 1 91101 910 VR 70 
2 Kimberley 5616 1 91201 910 VR 70 
3 Kelowna 58940 5 93101 930 BF/EA 165 
4 Vernon 20191 2 93201 930 VR 165 
5 Penticton 18542 1 93301 930 VR 165 
6 Trail/Rossland 17825 1 93401 930 VR 165 
fé Kamloops 47406 6 94101 940 BF/EA 100 
8 Vancouver 1005675 isi6) 95101 950 BF/EA 279(419) 
Vancouver 95501 950 BF/EA 279(419) 
* APT 2 95100 950 APT 279(419) 
~ APT 95500 950 APT 279(419) 
9 Mission/Matsqui 54597 4 95201 950 VR 165 
10 Chilliwack 30225 2 95301 950 VR 120 
11 Powell River 12493 1 95401 950 VR 165 
12 Nanaimo 36571 3 96201 960 VR 140 
13 Victoria 184511 17 96101 960 BF/EA 170(189) 
" APT 1 96100 960 APT 170(189) 
14 Port Alberni 16448 1 96301 960 VR 165 
15 Prince George 48354 5 97101 970 BF/EA 140 
16 Dawson Creek/Ft. St.John 18526 2 98101 980 VR 70 
iF Kitimat/Terrace 19703 1 99201 990 VR 70 
18 Prince Rupert 12552 1 99101 990 VR 70 
TOTAL 1619806 107 REGULAR 
3 APT 
1 As onthe map. - Voir la carte 
2 BF 


m 
b 
Wo We a ie he 


Block-face counts from Area Master File used to form clusters. - Utilisant les chiffres pour les cotes dilots provenant du fichier principal des regions. 


Counts derived from Visitation Records used to form clusters. - Utilisant les chiffres provenant des registres des visites 


Enumeration Areas used to form clusters. - Utilisant les secteurs de dénombrement 


Apartment Buildings used to form clusters. - Utilisant les immeubles d'appartements 
Inverse Sampling Rate (after 1986 sample reduction). 
Fraction de sondage inverse (apres la réduction de la taille de l'echantillon en 1986) 


Sample Summary 
Table 10A 
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Sommaire de l’echantilion 


Tableau 10A 
Non Self-Representing Self-Representing 
Non autorepresentatif Autorepresentatif 
4 Design 1981 LF Number Number Number 1981 LF Number of Number 
EON CV Population of of PSUs of PSUs Population Sub-Units of APT 
Strata selected Sub-Units 
CV selon Population Nombre de Nombre de Nombre de Population Nombre de Nombre de 
plan active strata de UPE de UPE active sous-unites sous- unites 
en 1981 sélectionnes en 1981 APT 
Nfld. -— T.-N 7.30 19134 13 107 26 197136 32 0 
ll a od 8.90 62381 1 (Be 12 27390 te 0 
NS. - N-E 5.44 271491 15 148 33 355123 48 1 
N.B. - N-B 6 44 251488 16 159 32 257027 61 0 
Que Se 1293034 18 276 41 3584785 168 8 
Ont 3.69 1376563 23 305 47 5192518 215 21 
Man 6.75 216461 15) noe roy 524134 68 2 
Sask. 7.26 336447 20 225 40 352140 91 1 
Alb. — Alta 6.20 504034 20 198 52 1118006 125 4 
B.C. - C.-B 5.39 450597 12 137 30 1619806 107 3 
Canada 4954430 153 1704 344 13228065 928 40 
. . 5 7 . 2 
Sample Summary Following 1989-1990 Sommaire de l’echantillon apres 
Increase augmentation en 1989-1990 
Table 10B Tableau 10B 
Household 
Menages 
Province Self-Representing Non-Self- Sampling Actual CV (%) 
Representing Fraction (%) Unemployed 
Total 
Autorepresentatif Non-auto- Fraction CV actuel (%) 
representatif de sondage (%) chomeurs 
Newfoundland - Terre-Neuve 1263 1707 2970 1.73 7.4 
Prince Edward Island — lle-du-Prince-Edouard 411 1010 1421 3.21 69 
Nova Scotia — Nouvelle-Ecosse 1850 2559 4409 1.39 5.5 
New Brunswick — Nouveau-Brunswick 1923 1920 3843 1.54 55 
Quebec 7053 4903 11956 0.47 39 
Ontario 12126 5919 18045 051 36 
Manitoba 2080 2217 4297 1.07 TA 
Saskatchewan 2609 2354 4963 1.34 6.1 
Alberta 3096 2529 5625 0.62 51 
British Columbia - Colombie-Britannique 3641 1829 5470 0.45 58 
36052 26947 62999 0.64 1.9 


Canada 


Special Area Sample 
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L’échantillon dans les secteurs spéeciaux 


Table 11 Tableau 11 
Frame Coverage Design 
Province 
Base Couverture Plan 
Newfoundland -— Terre-Neuve instit & milit province collective EAs/SD collectifs 
remote/eloignees ER/RE 30 place names/noms de localitees 
Nova Scotia - Nouvelle-Ecosse instit & milit province collective EAs/SD collectifs 
New Brunswick -— Nouveau-Brunswick instit & milit province collective EAs/SD collectifs 
Quebec instit & milit province collective EAs/SD collectifs 
remote/eloignees ER/RE 400,490 place names/noms de localitees 
remote/eloignees ER/RE 400,480,490 urban centres/centres urbains 
Ontario instit & milit province collective EAs/SD collectifs 
remote/eloignees ER/RE 591,592 EAs/SD 
Manitoba instit & milit province collective EAs/SD collectifs 
remote/eloignees ER/RE 650,680 place names/noms de localitees 
Saskatchewan instit & milit province collective EAs/SD collectifs 
remote/eloignees ER/RE 750,760 place names/noms de localitees 
Alberta instit & milit province collective EAs/SD collectifs 


British Columbia — Colombie- 
Britannique 


remote/eloignees 


instit & milit 
remote/eloignees 


ER/RE 870,880 


province 
ER/RE 980,990 


EAs/SD 


collective EAs/SD collectifs 


place names/noms de localitees, EAs/SD 


a be Statistics Canada 
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1 
HOUSEHOLD RECORD DOCKET | CONFIDENTIAL) 4 conm no 03 

Docket no. Survey date , Assignment no. Designated interviewer no. Your interviewer no. 

epee Te i 4 [ | oo | 
change 

P.S.U. Group Custer Rot. no. Listing Mutt. Type of dwelling 

6! Pa Fat ioe tea amet En 
J es 7 L Ly 8 Leeoe 
Record time of every call on this household. Listing address 


T 


i 


et 


1 
Yes @ Go 


FIRST INTERVIEW WITH THIS HOUSEHOLD 


WOULD YOU PREFER TO BE INTERVIEWED 1 
IN ENGLISH OR IN FRENCH? 
3 ae 
Either bux) 


1 2 
English O French ‘e 
~ 
‘O 
Neither 


1 


| | ar | 11 0} 
= se ——f——___}____=__ 4 
. ieee i | 41 INTERVIEWER CHECK ITEM: 
} | © Is this the first interview at this dwelling 
— —— = a iL | or a new household since last interview” 


INTERVIEWER CHECK ITEM: 
Language of interview 


—) 2) af) 
English we) French ey, Other \_/ 


Go to 15 


1 2 IS (read listing address in item 10) 
YOUR CORRECT MAILING ADDRESS? 
address on Form 23 


Yes e Goto13 No 
and go to 13 
SUBSEQUENT INTERVIEW 
* if Personal interview 


1 
O Go to 21 
* Otherwise ask. 


ARE YOU STILL LIVING IN THE SAME 
DWELLING AS LAST MONTH? 
@ where possible, state listing address 


2 Enter correct mailing 
a 


to12 No \_/ Goto 20 


> 


1 


NO USUAL PLACE OF RESIDENCE ELSEWHERE? 
Enter names in 32 


WHAT ARE THE NAMES OF ALL PERSONS NOW LIVING OR STAYING HERE WHO HAVE 


2 oe 3 Personal visit 
Yes Go to 21 No required 


DO THE FOLLOWING PERSONS STILL 


ARE THERE ANY PERSONS AWAY FROM THIS HOUSEHOLD ATTENDING SCHOOL, 
VISITING, TRAVELLING OR IN HOSPITAL WHO USUALLY LIVE HERE? 


No 2 Go to 22 


16 


Yes | Enter names in 32 and go to 22 


LIVE OR STAY AT THIS DWELLING? 


© Read all names in 32. 
* Enter appropriate code in 40. 


22 DOES ANYONE ELSE LIVE AT THIS DWELLING SUCH AS OTHER RELATIVES, 
ROOMERS, BOARDERS OR EMPLOYEES? 
1 
Yes O Enter names in 32, COMPLETE 33 through 40 
and go to 42 


20, 
No @) © For a first interview, COMPLETE 33 through 40 and go to 42 


© For a subsequent interview, go to 42 


32 135 


Names of household members Age 


x On 
nz 


Given | 
name 


Surname 


36|37|38 | 40 [50 


Answers to supplementary questions 
a 


R 
to 
H 


Membership 


Given 
name 


Surname 


eee ei 


3 


Given | | 
name 
‘ahs 


Surname | | 


abe 
Given 
name 


4 


Surname 


Given i 
am 
5 n e | 


Surname | 


TT Given 
name 


Surname 


+—+ - 
Given 
name | 
Ta 
EH 


+ 


Given 
name 
a 


Surname | 
L 


42 1S THIS DWELLING OWNED BY A MEMBER OF THIS HOUSEHOLD? 


1 
ves 'C) 


Go directly to 
FORMS 05 & 06 


com 
43 FOR ALL HOUSEHOLDS 


Telephone no 
| Siam | 


sme meee eeee= (Of 


“Telephone no. 2 


refused 
Go to 44 


2 
No (Biecripes FORM 04 


— AT END OF INTERVIEW 


Permission to interview 


by phone 
ee Granted 30) 
<) 


Go to 
“4 


eee eeeese= sy 


Denied 
No telephone 


44 Determine and record the best time to call on this household. 


A7 Forms Control 


455 RESPONSE CODE 
Month 


46 


Was this interview 
conducted by 
telephone? 


Code 
ne) 
ay 


2 
No 


e 
PHS = Completed! | 
IF CODE 'B™ 


EXPLAIN IN NOTES 


ra 


Printed | | 
ae t | 


NOTES 
See over for additional NOTES. 
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T 

[Lnfpetaltem no.} 

b — 
1 


Oo 


STC/HKLO 035 02581 STC P-PUOIS FRANCAIS 


AU VERSO Authority - Statistics Act, Revised Statutes 


5080-473 21-12 


of Canada, 1985, chapter S19 


tatstique ( 


LABOUR FORCE SURVEY QUESTIONNAIRE 


CONFIDENTIAL when completed 


05 


Docket No 2 | ' L L_4 ] Survey date 3 Assignment No. 4 { 
HRD page -lineNO Given na = a Mo Yr Gomme aa 
f T es Sgn oy | 
s[ |] 6 183) eu s Roce eReee 
7 7 B OR BUSINESS? 
LAST WEEK, DID... WORK AT A JOB OR LAST WEEK, DID... HAVE A JOB OR BUSI |5Q) HAS. . . EVER WORKED AT A JO 
10 Business? (Regardless of the number of 30 Ness AT WHICH HE/SHE DID NOT WORK? IC i Oe 
hours. 1 2 
ves | O No * C) & to 30 ves' © 0 33 »*O-> 51 WHEN DID... LAST WORK AT A JOB OR BUSINESS? 
ee eee 1) 31 LAST WEEK, DID... HAVE A JOB TO START ae 
= PERMANENTLY unable to work Go to'50 ai AT A DEFINITE DATE IN THE FUTURE? ea > [ a 
41 DID... HAVE MORE THAN ONE JOB OR iene —1 I 
BUSINESS LAST WEEK? Yes No Gowso | @l > Mo 1 
' 2 COUNTING FROM THE END OF LAST WEEK, | change Fe 7 month unknown, antec San ont 
= ves' Ot O wots |32 IN HOW MANY WEEKS WILL . . . START TO REECE CHEDIOTIELE 
42 WAS THIS A RESULT OF CHANGING WORK AT HIS/ HER NEW JOB? 52 
EMPLOYERS LAST WEEK? ie tes, (1) 1 51 is before. ler 
1 2 (2) # 517 & equal to 
nee Ae, WHY WAS .. . ABSENT FROM WORK LAST | OF fater than... 2C wwss3 
43 HOW MANY HOURS PER WEEK DOES .. . So eae jonas i Mo YF 
JEU O RUS MUI SAIS and if code 53 DID. . . USUALLY WORK 30 OR MORE HOURS PER 
(Main) JOB? i tol BIGO 1S Z WEEK? : 
ibs els 34 DID... HAVE MORE THAN ONE JOB OR ree Pesan Ao 2 
Other jobs? goto 15 BUSINESS LAST WEEK? (30 of more hours (Less than 3 
cA Nesta 1 2 per week) per week) 
44 WHAT IS THE REASON . . . USUALLY WORKS ves'©C) 7? O 54 WHAT WAS THE MAIN REASON WHY... . LEFT THAT JOB? 
LESS THAN 30 HOURS PER WEEK? 35 HOW MANY HOURS PER WEEK DOES . . . i as 
— Emer USUALLY WORK AT HIS/HER: 
ee [55 INTERVIEWER CHECK ITEM: 
9 
45 LAST WEEK, HOW MANY HOURS OF Mane inate g es er te Oe 
OVERTIME OR EXTRA HOURS DID... ——— es eS ' 
WORK? Other jobs? ete) © Otherwise @ go to 56 
(Include paid and unpaid if none —_ 
LEC IES) L GReOi 36 WHAT IS THE REASON . . . USUALLY WORKS 5 & “IN THE PAST 6 MONTHS, HAS . . LOOKED FOR WORK? 
416 LAST WEEK, HOW MANY HOURS WAS . . . HOURS PER WEEK? "> ‘ 
AWAY FROM WORK FOR ANY REASON? PREC Yes O) no * CO) Go 0 64 
(Holiday, vacation, illness, labour dispute, etc.) 57 TCAIE CREF WEE ICS WHATIEIAS Sana BND 
UP TO THE END OF LAST WEEK, HOW MANY ° , ee 
37 WEEKS HAS ... BEEN CONTINUOUSLY ABSENT WORK? Mark all methods reported. 
(From alll jobs) LIER EET FROM WORK? Nothing C | G10 62 
and to 18 
a = | © IN THE PAST 4 WEEKS, HAS ... DONE ANYTHING ELSE 
17 WHAT WAS THE MAIN REASON FOR BEING TO FIND WORK? Mark all other methods reported. 
AWAY FROM WORK? 38 |S... GETTING ANY WAGES OR SALARY For each method given, ask 
FROM HIS/HER EMPLOYER FOR ANY TIME 
Enter code OFF LAST WEEK? © WHENDID...LAST____? 
ms (Repeat method ) 
eo ®) ©) No. of weeks 
418 HOW MANY HOURS DID .. . ACTUALLY WORK gi Nee ose 
TASTBOCE EAT HISITELY: 3Q TERVIEWER CHECK ITEM: Checked with used svy. week) 
2 
(Main) JOB? y 
Pee) ee nee Mn PL @ Bom 56 PUBLIC employment AGENCY 4 ) 
Other Jobs? seis, AO) daar PRIVATE employment AGENCY 
——— 4 
49 IN THE PAST 4 WEEKS, HAS . .. LOOKED FOR 140 IN THE PAST 4 WEEKS, HAS .. . LOOKED FOR NION 
ANOTHER JOB? ANOTHER JOB? = 
@ EMPLOYERS di h 
seee © No 2 O Yas! O No 2 O vey 
Go to 72 Go to 72 FRIENDS or relatives 


DESCRIPTION OF MAIN JOB OR BUSINESS 


Placed or answered ADS 


LWOUUOUU 


Le FOR WHOM DID ... WORK? (Name of business, goverment dept. or agency, or person) 8 
LOOKED at job ADS 
woh > Z 
change > OTHER, Specify in NOTES 
58 UP TO THE END OF LAST WEEK, HOW MANY WEEKS 
HAS .. . BEEN LOOKING FOR WORK? 
(Not counting weeks worked.) 
73 WHEN DID... START WORKING FOR THIS EMPLOYER? 59 WHAT WAS . vs MAIN ACTIVITY BEFORE HE/SHE 
Mo. Yr Mo. Yr STARTED TO LOOK FOR WORK? Ent 
® > H month unknown ue 
No 1 ! on | enter -- in month code 
change 60 IS... LOOKING FOR A JOB TO LAST MORE THAN 6 
74 WHAT KIND OF BUSINESS, INDUSTRY OR SERVICE WAS THIS? (Give full description: e.g., MONTHS? 
federal govemment, canning industry, forestry services.) ee @ Neve ® 
(More than 6 months) (6 months or less) 
woh > 61 IS... LOOKING FOR A FULL-TIME OR PART-TIME JOB? 
change 1 2 
[ara] > Full-time @ Part-time O 
(30 of more hours (Less than 30 hours 
per week) per week) 
75, A WHAT KIND OF WORK WAS... DOING? (Give full description: e¢., office clerk, factory worker, yan 3 
forestry technician., 
) 62 WHAT WAS THE MAIN REASON WHY .. . DID NOT LOOK 
'@ > FOR WORK LAST WEEK? —— 
ne : Enter code 
change 
o> | 63 WAS THERE ANY REASON WHY ... COULD NOT TAKE A 
| JOB LAST WEEK? 
Enter code 
75B IN THIS WORK, WHAT WERE ... MOST IMPORTANT ACTIVITIES OR DUTIES? 64 INTERVIEWER CHECK ITEM: 
(Give full description: eg., filing documents, drying vegetables, forest examiner.) SHENON Rea neS e @s Siok 
3 
we» ° 1 upper circle in 52 is marked Olzine0 
Co > 4 
*° Otherwise Or to 72 
EDUCATIONAL ACTIVITIES {1 ver, go to 90) 
Class of work: LAST WEEK, WAS ATTENDING A SCHOO! OLLE: 
76 eae ( 0 es \ 80 orunivensiry? Re ae? 
Main job won MR >[ | ca ae i alo) no 7 C) Goto 90 
a a) eS 81 CAS Cuno RED AS A FULL-TIME OR A PART-TIME 
Other job No 1 [] oP ? Full Part 
77 > code go to 80 time y © time ‘ O 
= NOTES 82 WHAT KIND OF SCHOOL WAS THIS? 


Tem no. 


[ FRANCAIS AU VERSO 


[| eer cove 


QO _1RD page-tine No. of parson providing LE SRY 


the above information. 
This 


Last 
interview interview 
iia 


- Statistics Act; Chapter 15, 
Statutes of Canada 1970-71-72” 


| a Statistique Statistics 
Canada Canada DOCUMENT CONFIDENTIEL | 


DOSSIER DU MENAGE une fois rempli 1 FORMULE 03 
Date dienquéte No detache N° de l'intervieweur désigne Votre n° d’intervieweur 
| | [o 1 | 
ial 4 ‘ 5 eS aia 
changement 
UP.E ~ Groupe Greppe N° de renouy N° de liste Genre de logement 
] 7 } Inscrivez 
~~ ie ————e | l 4 bn | ee (e) le code 
—_ Notez Uheure de chaque visite Ou uppel a ce menage Adrease de liste 
a < 5 i de cao =r aes: = ] 
9 1 |Lun 5 . E 5 ; 1 0} 
2 |Mar ; ‘ : 5 : | 
4 4 —+ - + = 
| | p : : 5 : P 
po) Mersl Fe) ek Mo ee te a 1 1 A L'INTERVIEWEUR: 1 2 EST-CE QUE (lisez |‘adresse de liste au poste |0) 
ra RS : . 5 | aa | e S‘agit-1/ de la premiere interview a ce EST VOTRE ADRESSE POSTALE EXACTE? 
Bie = { ——s = a eae logement ow d'un nouveau menage 
5 |Ven 4 F 3 ‘ ® depuis la dermiere interview? 1 2 Inscrire ‘adresse postale 
| = oan ee a eal ea ae oe 1 1@) Oui Passez@13 Non exacte sur la formule 23 
. . | Oui Passez 412 Non Passez 4 20 ef passez 4 13 


PREMIERE INTERVIEW DANS CE MENAGE 


1 PREFEREZ-VOUS ETRE INTERVIEWE(E) EN 4 4 A L'INTERVIEWEUR: 
FRANCAIS OU EN ANGLAIS? Langue de I'interview 


1 2 3 
Anglais & Francais ‘Se L'un ou I'autre ©) 


4 
Ni l'un ni l'autre 2 Passez 215 


1 5 VEUILLEZ NOMMER TOUTES LES PERSONNES QUI DEMEURENT ACTUELLEMENT ICI 
ET QUI N'ONT PAS DE RESIDENCE HABITUELLE AILLEURS. 


Inscrivez les noms a 32 


1 6 Y A-T-IL DES PERSONNES QUI SONT ABSENTES DU MENAGE PARCE QU’ELLES SONT AUX ETUDES, 
EN ue EN VOYAGE OU A L'HOPITAL, MAIS QUI DEMEURENT HABITUELLEMENT ICI? 


INTERVIEW SUBSEQUENTE 


1 
* S'il s'agit d'une interview sur place O Passez 4 21 
* Autrement, demandez: 
DEMEUREZ-VOUS ENCORE DANS LE MEME 
LOGEMENT QUE LE MOIS DERNIER? 
* lorsque possible, confirmez | ‘adresse de liste 


2c) 3 Visite sur place 
Oui Passez a 21 Non nécessaire 


LES PERSONNES SUIVANTES DEMEURENT- 
ELLES ENCORE DANS CE LOGEMENT? 


* Lisez tous les noms inscrits & 32. 
* Inscrivez le code approprié au poste 40. 


Gay 2 3( 


Anglais \_/ Francais Autre‘ 


Qui i Inscrivez les noms a 32 et passez a 22 Non 2 Passez a 22 


2 Y A-T-IL QUELQU'UN D’AUTRE QUI DEMEURE DANS CE LOGEMENT, PAR EXEMPLE 
UN PARENT, UN CHAMBREUR, UN PENSIONNAIRE OU UN EMPLOYE? 


2 O © Pour une premiere interview, REMPLISSEZ les postes 
Non 33 a 40, puis passez 4 42 


* Pour une interview subséquente, passez 4 42 


1 
Oui ©) Inscrivez les noms a 32, REMPLISSEZ les postes 
33 a 40, puis passez a 42 


31 32 33 34/35/|36/137/38 40 '50 Réponses aux questions supplémentaires 


Noms des membres du ménage Age Composition 


ox on 
rm 
3a nc 


Prénom | } a a 


Nom de! | | 


| famille | | Mt { oa ee 4—+ iz re 


Prénom 


— 
Nom de | | 
famille | a 22} | deme | lle ee lek ++ +--+ + 


Prénom | 


Nom de | 
famille | | | 
+—t+—+ + + 

Prénom | 


ap 
+ 
| 
al| 

HE 


Nom de | 


| | 
famille | 4 | } | » Leseear | ca i + ne 
Prénom | | | | 


ef 


Nom de! | | | 
famille Me | | 
1S 


Prénom | | 


Nom de | | 


il famille | a uf + Al Sate H 


Prénom| | | 
| | 
Vik de | | | | 


6 | 

7 | 
famille | : | jae, AE EME a! eee Bed Eee 4 t —— Tt ea Een ee 

8 


it 
| 
| Prénom | | 


Sixom de! | 


| famille i 


42 CE LOGEMENT APPARTIENT-IL A UN MEMBRE DE CE MENAGE? 


1 Passez directement 2c) Barck eee 
Ou} aux FORMULES 05et06 Non lemplissez la 


REMPLISSEZ A LA FIN DE L'INTERVIEW 2 


43 Pour Tous LES MENAGES 


No de telgphone - Permission d interviewer 

| = |\> par téléphone | 
l 

Accordée / 


ewe eee memes [0 | ewe eee eee= sy ~ a 
. 4 
1c) N° de téléphone 2(_) ! ) 
Pas de téléphone G) P oe, 1 Refusée ee 
1 
i) 


refusé 
at 
Passez a 44 
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Appendix G 


Definitions and Explanations 


Labour Force 


The labour force is composed of those members 
of the civilian non-institutional population 15 years of 
age and over who, during the reference week, were 
employed or unemployed. 


Employed 


Employed persons are those who, during the 
reference week: 


(a) did any work’ at all 
(6) had a job but were not at work due to: 


- own illness or disability 

- personal or family responsibilities 

— bad weather 

— labour dispute 

-— vacation 

- other reason not specified above (excluding 
persons on layoff and persons whose job 
attachment was a job to start at a definite date 
in the future). 


Unemployed 


Unemployed persons are those who, during the 
reference week: 


(a) were without work, had actively looked for work in 
the past four weeks (ending with reference week), 
and were available for work 2; 


(6) had not actively looked for work in the past four 
weeks but had been on layoffs and were available 
for work; 


1 Work includes any work for pay or profit, that is, paid 
work in the context of an employer-employee relation- 
ship, or self-employment. It also includes unpaid family 
work where unpaid family work is defined as unpaid work 
which contributed directly to the operation of a farm, 
business or professional practice owned or operated by 
a related member of the household. 

2 Persons in this group meeting the following criteria are 
regarded as available: 

(i) were full-time students seeking part-time work who 
also met condition (ii) below. (Full-time students 
looking for full-time work are classified as not 
available for work in the reference week.) 


(ii) reported that there was no reason why they could 
not take a job in reference week, or if they could not 
take a job it was because of “own illness or 
disability", "personal or family responsibilities", Or 
"already had ajob". 

3 Persons are classified as being on layoff only when they 
expect to return to the job from which they were laid off. 


Annexe G 


Definitions et explications 


Population active 


La population active comprend les membres de la 
population civile hors institution agés de 15 ans et plus qui 
avaient un emploi (personnes occupées) ou étaient en 
chomage pendant la semaine de référence. 


Personnes occupées 


Les personnes occupeées sont celles qui, au cours de la 
semaine de reference: 


a) ont fait un travail! quelconque 


b) avaient un emploi mais n’étaient pas au travail pour |’une 

des raisons suivantes: 

— maladie ou invalidité (de l’enquéte) 

-— obligations personnelles ou familiales 

— mauvais temps 

— conflit de travail 

— vacances 

— autre raison non precisée ci-dessus (a l'exception des 
personnes mises a pied et de celles qui devaient com- 
mencer a travailler a une date ulterieure déterminee). 


Chomeurs 


Les choémeurs sont les personnes qui, au cours de la 
semaine de reference: 


a) étaient sans emploi, avaient activement cherche du travail 
au cours des quatre dernieres semaines (y compris la 
semaine de référence) et étaient prétes a travailler 2; 


b) n'avaient pas activement cherche de travail au cours des 
quatre dernieéres semaines, mais avaient ete mises a 
pieds et étaient prétes a travailler; 


1 On entend par "travail" tout travail fait contre remuneration ou en 


vue d'un benefice, c'est-a-dire le travail fait contre remuneration 

pour un employeur ou a son propre compte. /l peut egalement 

s'agir d'un travail familial non remuneéreé, c'est-a-dire d'un travail 
non remunere gui contribue directement a |'exploitation d'une 
ferme, d'une entreprise Ou d'un bureau professionnel, qui est 
possédé ou exploité par un membre apparente du menage. 

2 On considére comme prétes a travailler les personnes de ce 
groupe qui: 

(i) étudiaient a plein temps tout en cherchant du travail a 
temps partiel et qui repondaient au critere (ii) ci-dessous 
(Les @tudiants a plein temps qui cherchaient du travail a 
plein temps ne sont pas considérés comme ayant eté préets 
a travailler pendant la semaine de reference.) 

(ii) ont déclaré qu'il n'y avait aucune raison pour laquelle elles 
ne pouvaient prendre un emploi pendant la semaine de 
reference ou ne pouvaient en prendre un en raison "de 
maladie ou _ invalidite", "“d'obligations personnelles ou 
familiales", ou "parce qu’elles avaient déja un emploi" 

3 On considére comme mises a pied les personnes qui 
s'attendent a réintégrer l'emploi qu'elles occupaient avant d'étre 
mises a pied. 


(c) had not actively looked for work in the past four 
weeks but had a new job to start in four weeks or 
less from the reference week, and were available 
for work. 


Not in the Labour Force 


Those persons in the civilian non-institutional 
population 15 years of age and over who, during the 
reference week, were neither employed nor un- 
employed. 


Unemployment Rate 


The unemployment rate represents the number of 
unemployed persons expressed as a percentage of the 
labour force. The unemployment rate for a particular 
group (age, sex, marital status, etc.) is the number un- 
employed in that group expressed as a percentage of 
the labour force for that group. 


Participation Rate 


The participation rate represents the labour force 
expressed as a percentage of the population 15 years 
of age and over. The participation rate for a particular 
group (age, sex, marital status, etc.) is the labour force 
in that group expressed as a percentage of the 
population for that group. 


Employment/Population Ratio 


The employment/population ratio represents the 
number of persons employed expressed as a percen- 
tage of the population 15 years of age and over. The 
employment/population ratio for a particular group 
(age, sex, marital status, etc.) is the number employed 
in that group expressed as a percentage of the popu- 
lation for that group. 
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c) n’avaient pas activement cherché de travail au cours des 
quatre derniéres semaines, mais devaient commencer un 
nouvel emploi dans quatre semaines ou moins a compter 
de la semaine de référence, et étaient prétes a travailler. 


Inactifs 


ll s'agit de la partie de la population civile hors institution 
agée de 15 ans et plus qui était ni occupée ni en chomage 
pendant la semaine de reference. 


Taux de chomage 


Le taux de chémage représente le nombre de chomeurs 
exprimé en pourcentage de la population active. Le taux de 
chémage d'un groupe particulier (age, sexe, état matrimonial, 
etc.) est le nombre de chOmeurs dans ce groupe, exprime en 
pourcentage de la population active dans le meme groupe. 


Taux d’activite 


Le taux d’activité représente la population active exprimée 
en pourcentage de la population de 15 ans et plus. Le taux 
d’activité d’un groupe particulier (age, sexe, état matrimonial, 
etc.) est la population active dans ce groupe exprimee en 
pourcentage de la population dans le méme groupe. 


Rapport emploi-population 


Le rapport emploi-population représente le nombre de 
personnes occupées exprime en pourcentage de la population 
de 15 ans et plus. Le rapport emploi-population d’un groupe 
particulier (age, sexe, état matrimonial, etc.) est le nombre de 
personnes occupées dans ce groupe, exprimé en pourcentage 
de la population dans le méme groupe. 
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